๐ง GPT๋ ๋์ฝ๋ ๊ธฐ๋ฐ ํธ๋์คํฌ๋จธ ๋ชจ๋ธ
โ GPT = ํธ๋์คํฌ๋จธ์ ๋์ฝ๋ ๊ตฌ์กฐ๋ง ์ฌ์ฉํ ์ธ์ด ์์ฑ ๋ชจ๋ธ
๐ง ๋ชฉ์ ์ ๋ฐ๋ผ ๊ตฌ์ฑ ์ ํ:
- ์ธ์ฝ๋: ์ ๋ ฅ์ ์ดํดํ๋ ๋ฐ ๊ฐํจ → ๋ฌธ์ฅ ๋ถ๋ฅ, ์ง๋ฌธ์๋ต ๋ฑ
- ๋์ฝ๋: ๋ฌธ์ฅ์ ์์ฑํ๋ ๋ฐ ํนํ๋จ → GPT๋ ์ด๊ฑธ ํํจ!
๐ฆ ๋์ฝ๋๋ง ์ฐ๋ GPT์ ๊ตฌ์กฐ
GPT์ ๊ตฌ์กฐ๋ ๋ค์๊ณผ ๊ฐ์ ๊ธฐ๋ณธ ๋ธ๋ก์ ๋ฐ๋ณตํฉ๋๋ค:
[์
๋ ฅ ์๋ฒ ๋ฉ]
→ [ํฌ์ง์
๋ ์ธ์ฝ๋ฉ ์ถ๊ฐ]
→ [Masked Self-Attention]
→ [Feedforward Layer]
→ [Layer Norm + Residual]
→ (์ด ๋ธ๋ก์ ์ฌ๋ฌ ๋ฒ ๋ฐ๋ณต)
→ [์ถ๋ ฅ Softmax]
→ ๋ค์ ๋จ์ด ์์ธก
๐ ์ ์ธ์ฝ๋ ์์ด ๋์ฝ๋๋ง์ผ๋ก ๊ฐ๋ฅํ๊ฐ?
GPT๋ **“๋ค์ ๋จ์ด๋ฅผ ์์ธก”**ํ๋ ๊ฒ ๋ชฉ์ ์
๋๋ค.
์ฆ, ๋ฌธ์ฅ ์์ฑ๋ง ํ๋ฉด ๋๋ฏ๋ก, ์
๋ ฅ์ ๋ถ์ํด์ ์์ฝํ๋ ์ธ์ฝ๋๊ฐ ๊ตณ์ด ํ์ ์์ต๋๋ค.
๐ง ํต์ฌ ์ ๋ต: ์ธ์ด ๋ชจ๋ธ๋ง
- ์ฃผ์ด์ง ํ ์คํธ๋ฅผ ๋ณด๊ณ ๋ค์์ ๋์ฌ ๋จ์ด๋ฅผ ์์ธกํ๋ ํ๋ จ์ ํจ
- ์ : ์ ๋ ฅ: “๋๋ ์ค๋” -> ์์ธก: “๋ ์จ๊ฐ” (ํ๋ฅ ์ ์ผ๋ก ๊ฐ์ฅ ๋์ ๋จ์ด)
- ์ด๋ ๊ฒ ๋ฌธ์ฅ์ ํ๋์ฉ ์์ธกํ๋ฉฐ ์์ฑํ๋ฏ๋ก ์ธ์ฝ๋๋ ํ์ ์์
๐ Masked Self-Attention: ๋์ฝ๋์ ํต์ฌ
GPT๊ฐ ์ฌ์ฉํ๋ ๋์ฝ๋์๋ **"Masked Self-Attention"**์ด ์ ์ฉ๋ฉ๋๋ค.
| ๋ชฉ์ | ์ค๋ช |
| ๋ฏธ๋ ๋จ์ด ์ฐจ๋จ | ๋ค์ ๋จ์ด๋ฅผ ์์ธกํ ๋ ์์ง ๋์ค์ง ์์ ๋จ์ด๋ ๋ชป ๋ณด๊ฒ ํจ |
| ์ผ์ชฝ ๋ฌธ๋งฅ๋ง ์ฌ์ฉ | ์ง๊ธ๊น์ง์ ๋จ์ด๋ง ์ฐธ๊ณ ํด์ ๋ค์ ๋จ์ด๋ฅผ ๊ฒฐ์ |
์: “์ค๋์ ๋ ์จ๊ฐ ์ข” → “๋ค”๋ฅผ ์์ธกํ ๋ “์ข๋ค”๊ฐ ์ ๋ต์ด๋ผ๋ ๊ฑธ ์๋ฉด ์ ๋๋ฏ๋ก ์ ์ ๋ณด๋ง ์ฌ์ฉ
๐ GPT ๋์ฝ๋ ์๋ ํ๋ฆ ์์ฝ
- ๋ฌธ์ฅ์ ๋ฒกํฐ๋ก ์๋ฒ ๋ฉ
- ํฌ์ง์ ๋ ์ธ์ฝ๋ฉ ์ถ๊ฐ (์์ ์ ๋ณด ์ ๊ณต)
- Masked Self-Attention ์ํ (์ง๊ธ๊น์ง ๋ณธ ๋จ์ด๋ง ๋ด)
- ํผ๋ํฌ์๋ ๋ ์ด์ด๋ก ์๋ฏธ ํ์ฅ
- ๋ค์ ๋จ์ด๋ฅผ Softmax๋ก ์์ธก
- ์์ธก๋ ๋จ์ด๋ฅผ ์ด์ด์ ๋ค์ ์ ๋ ฅ → ๋ฐ๋ณต
โ GPT๊ฐ ๋์ฝ๋๋ง ์จ๋ ๊ฐ๋ ฅํ ์ด์
| ์ด์ | ์ค๋ช |
| ์์ฐ์ค๋ฌ์ด ์์ฑ | ์ผ์ชฝ๋ถํฐ ์ค๋ฅธ์ชฝ์ผ๋ก ์์ฐ์ค๋ฝ๊ฒ ๋ฌธ์ฅ ์์ฑ |
| ํ์ต ๋จ์ํ | ์ธ์ฝ๋ ์์ด ํ์ต ๊ตฌ์กฐ ๋จ์ํจ |
| ๋ค์ํ ํ์ฉ | ๋ํ, ์์ฝ, ์๋ฌธ ๋ฑ ์ฐฝ์์ ์์ ์ ์ ํฉ |
| ์ฌ์ ํ์ต → ์ ์ดํ์ต | ๋๊ท๋ชจ ํ ์คํธ๋ก ํ์ต ํ ๋ค์ํ ์์ ์ ์ฌ์ฉ ๊ฐ๋ฅ |
๐งฉ BERT vs GPT ๊ตฌ์กฐ ๋น๊ต
| ํญ๋ชฉ | BERT | GPT |
| ๊ตฌ์กฐ | ์ธ์ฝ๋๋ง ์ฌ์ฉ | ๋์ฝ๋๋ง ์ฌ์ฉ |
| ๋ฐฉํฅ | ์๋ฐฉํฅ | ๋จ๋ฐฉํฅ (์ผ→์ค๋ฅธ์ชฝ) |
| ๋ชฉ์ | ๋ฌธ์ฅ ์ดํด | ๋ฌธ์ฅ ์์ฑ |
| ์ | ๊ฐ์ ๋ถ์, ๋ฌธ์ ๋ถ๋ฅ | ๋ํ, ์๋ฌธ, ์ฝ๋ฉ |
๐ง ๊ฒฐ๋ก ์์ฝ
- GPT๋ ํธ๋์คํฌ๋จธ์ ๋์ฝ๋ ๊ตฌ์กฐ๋ง ์ฌ์ฉํ๋ ์ธ์ด ์์ฑ ๋ชจ๋ธ
- ๋ค์ ๋จ์ด ์์ธก์ด๋ผ๋ ๋จ์ผ ๋ชฉํ๋ก ์ค๊ณ๋์ด ์ธ์ฝ๋ ์์ด๋ ์ถฉ๋ถ
- Masked Self-Attention์ ํตํด ๋ฌธ์ฅ์ ์์๋๋ก ์์ฐ์ค๋ฝ๊ฒ ์์ฑ
- GPT-2, GPT-3, ChatGPT ๋ชจ๋ ์ด ๊ตฌ์กฐ๋ฅผ ๋ฐํ์ผ๋ก ๋ง๋ค์ด์ก์ต๋๋ค
'์ธ๊ณต์ง๋ฅ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
| ๐ง LangChain์ด๋? (0) | 2025.05.26 |
|---|---|
| ๐ GPT๋? (0) | 2025.05.26 |
| Variational Encoder (๋ณ๋ถ ์ธ์ฝ๋)๋? (1) | 2025.05.26 |
| ์ธ์ฝ๋๋ง ์ฌ์ฉํ๋ BERT (0) | 2025.05.26 |
| ๐ ์ธ์ฝ๋(Encoder)์ ๋์ฝ๋(Decoder)๋? (0) | 2025.05.26 |