๐ ํธ๋์คํฌ๋จธ๋?
**ํธ๋์คํฌ๋จธ(Transformer)**๋ 2017๋
Google์ด ๋ฐํํ ๋
ผ๋ฌธ
**“Attention is All You Need”**์์ ์๊ฐ๋ ์์ฐ์ด ์ฒ๋ฆฌ(NLP) ๋ชจ๋ธ ๊ตฌ์กฐ์
๋๋ค.
๊ธฐ์กด์๋ RNN, LSTM์ด ์ฃผ๋ ฅ์ด์๋ค๋ฉด, ํธ๋์คํฌ๋จธ๋ ์ด ๊ตฌ์กฐ๋ฅผ ์์ ํ ๋์ฒดํ๋ฉด์
ํ์ฌ๋ GPT, BERT, ChatGPT, Claude, Gemini ๋ฑ ๊ฑฐ์ ๋ชจ๋ ์ต์ AI ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ด ๋์์ต๋๋ค.
๐ฆ ์ ๋์์๊น? (๊ธฐ์กด ๋ฐฉ์์ ํ๊ณ)
โ ๊ธฐ์กด ๋ฐฉ์ (RNN, LSTM)
- ๋ฌธ์ฅ์ ๋จ์ด ์์๋๋ก ํ๋์ฉ ์ฒ๋ฆฌ (ex: “๋๋ → ์ค๋ → ํ๊ต์…”)
- ๊ณผ๊ฑฐ ๋จ์ด์ ์๋ฏธ๋ฅผ ๊ธฐ์ตํ๋ฉฐ ์ฒ๋ฆฌํ์ง๋ง, ๋ฌธ์ฅ์ด ๊ธธ๋ฉด ์๋ถ๋ถ ์ ๋ณด๋ฅผ ์๊ธฐ ์ฌ์ (์ฅ๊ธฐ ์์กด์ฑ ๋ฌธ์ )
- ๊ณ์ฐ์ด ์ง๋ ฌ ์ฒ๋ฆฌ์ด๊ธฐ ๋๋ฌธ์ ๋๋ฆผ
โ ํธ๋์คํฌ๋จธ์ ํ์
- ์์ฐจ์ ์ผ๋ก ์ฒ๋ฆฌํ์ง ์๊ณ , ๋ชจ๋ ๋จ์ด๋ฅผ ๋์์(๋ณ๋ ฌ๋ก) ์ฒ๋ฆฌ
- ๊ฐ ๋จ์ด๊ฐ ๋ค๋ฅธ ๋ชจ๋ ๋จ์ด์ ์ฃผ์๋ฅผ ๊ธฐ์ธ์ด๋ ๊ตฌ์กฐ (์ดํ ์ )
๐ก ํต์ฌ ์์ด๋์ด: “๊ฐ ๋จ์ด๊ฐ ๋ฌธ์ฅ ๋ด ๋ค๋ฅธ ๋จ์ด๋ค์ ๋ณด๋ฉฐ ์ค์ค๋ก ์ค์๋๋ฅผ ํ๋จํ์!”
๐ง ํธ๋์คํฌ๋จธ์ ๊ตฌ์กฐ
ํธ๋์คํฌ๋จธ๋ ํฌ๊ฒ 2๋ถ๋ถ์ผ๋ก ๋๋ฉ๋๋ค:
| ๊ตฌ์กฐ | ์ญํ |
| Encoder | ์ ๋ ฅ ๋ฌธ์ฅ์ ์ดํดํ๊ณ ์์ฝ |
| Decoder | ์ดํดํ ์ ๋ณด๋ฅผ ๋ฐํ์ผ๋ก ์ถ๋ ฅ ๋ฌธ์ฅ์ ์์ฑ |
๊ฐ๊ฐ ์ฌ๋ฌ ์ธต(layer)์ผ๋ก ๊ตฌ์ฑ๋์ด ์๊ณ , ๊ฐ ์ธต์ ์๋์ ๊ฐ์ ๊ตฌ์ฑ์์๋ฅผ ํฌํจํฉ๋๋ค.

โจ ํต์ฌ ๊ตฌ์ฑ ์์
1. Self-Attention (์๊ธฐ ์ฃผ์ ๋ฉ์ปค๋์ฆ)
- ๊ฐ ๋จ์ด๊ฐ ๋ฌธ์ฅ ๋ด์ ๋ค๋ฅธ ๋ชจ๋ ๋จ์ด์ ๊ด๊ณ๋ฅผ ๊ณ ๋ ค
- ์: “I ate the apple because it was delicious” → “it”์ด ๊ฐ๋ฆฌํค๋ ๊ฒ “apple”์์ ํ์
2. Multi-Head Attention
- Self-Attention์ **์ฌ๋ฌ ๊ฐ์ ๋ค๋ฅธ ์์ (Head)**์ผ๋ก ๋ณ๋ ฌ๋ก ์คํ
- ๋ค์ํ ๋ฌธ๋งฅ ์ ๋ณด๋ฅผ ๋์์ ํ์ต ๊ฐ๋ฅ

3. Feed Forward Network (FFN)
- ๊ฐ ๋จ์ด ๋ฒกํฐ์ ๋ ๋ฆฝ์ ์ผ๋ก ์ ์ฉ๋๋ ์์ ์ ๊ฒฝ๋ง
4. Residual Connection + Layer Normalization
- ํ์ต ์์ ํ, ์ฑ๋ฅ ํฅ์์ ์ํ ๊ตฌ์กฐ
5. Positional Encoding
- ๋ณ๋ ฌ ์ฒ๋ฆฌ ๋๋ฌธ์ ๋จ์ด์ ์์๋ฅผ ๋ฐ๋ก ํํํด์ค์ผ ํจ
- ๋จ์ด ์์น๋ฅผ ๋ฒกํฐ๋ก ๋ํด์ค
๐ง ์ด๋ป๊ฒ ๋์ํ ๊น? (๊ฐ๋จํ ํ๋ฆ)
์: ์์ด → ํ๋์ค์ด ๋ฒ์ญ
์ธ์ฝ๋
์
๋ ฅ: “How are you”
↓
Positional Encoding ์ถ๊ฐ
↓
Self-Attention → FFN → Self-Attention → FFN … (๋ฐ๋ณต)
↓
๋ฌธ์ฅ์ ์๋ฏธ๋ฅผ ๋ด์ ๋ฒกํฐ ์์ฑ
๋์ฝ๋
์์ ํ ํฐ <BOS> ์
๋ ฅ
↓
Decoder Self-Attention
↓
์ธ์ฝ๋์ ์ ๋ณด + ์ดํ
์
(Encoder-Decoder Attention)
↓
๋จ์ด ํ๋์ฉ ์์ฑ (์: Comment → allez → vous …)
โ ํธ๋์คํฌ๋จธ์ ์ฅ์
| ์ฅ์ | ์ค๋ช |
| ๋ณ๋ ฌ ์ฒ๋ฆฌ ๊ฐ๋ฅ | ํ์ต ์๋๊ฐ RNN/LSTM๋ณด๋ค ํจ์ฌ ๋น ๋ฆ |
| ๊ธด ๋ฌธ์ฅ ์ดํด | Self-Attention์ผ๋ก ์ฅ๊ธฐ ์์กด์ฑ ๋ฌธ์ ํด๊ฒฐ |
| ์ ์ฐ์ฑ | ์ธ์ด, ์ด๋ฏธ์ง, ์ค๋์ค ๋ฑ ๋ค์ํ ๋๋ฉ์ธ์ ์ ์ฉ ๊ฐ๋ฅ |
| ํ์ฅ์ฑ | GPT, BERT ๋ฑ ๋ค์ํ ๋ชจ๋ธ ๊ตฌ์กฐ๋ก ์งํ ๊ฐ๋ฅ |
๐ ํธ๋์คํฌ๋จธ ๊ธฐ๋ฐ ๋ชจ๋ธ ์์
| ๋ชจ๋ธ | ๋ชฉ์ |
| BERT | ๋ฌธ์ฅ ์ดํด (๋ถ๋ฅ, ์ง์์๋ต ๋ฑ) |
| GPT | ๋ฌธ์ฅ ์์ฑ (๋ํ, ์๋ฌธ ๋ฑ) |
| T5 / BART | ์ธ์ฝ๋-๋์ฝ๋ ๊ธฐ๋ฐ์ ๋ฌธ์ฅ ๋ณํ |
| ViT | ์ด๋ฏธ์ง ์ธ์ |
| Whisper | ์์ฑ ์ธ์ |
| ChatGPT | GPT ๋ชจ๋ธ์ ์์ฉํ ๋ํํ AI |
๐ ๊ฒฐ๋ก ์์ฝ
- ํธ๋์คํฌ๋จธ๋ ์์ฐจ ๊ตฌ์กฐ๋ฅผ ์ ๊ฑฐํ๊ณ ์ดํ ์ ๋ง์ผ๋ก ๋์ํ๋ ๋ชจ๋ธ์ ๋๋ค.
- ๊ฐ ๋จ์ด๊ฐ ๋ฌธ๋งฅ ์ ์ฒด๋ฅผ ๋ณด๊ณ ์ค์ค๋ก ์ค์๋๋ฅผ ํ๋จํจ์ผ๋ก์จ ๋ ํ๋ถํ ์ดํด๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
- ํ์ฌ ๋ชจ๋ ์ต์ AI ๋ชจ๋ธ์ ๊ธฐ๋ณธ ๋ผ๋์ด๋ฉฐ, NLP๋ฟ ์๋๋ผ ๋ฉํฐ๋ชจ๋ฌ ์ธ๊ณต์ง๋ฅ์ ๊ทผ๊ฐ์ด ๋๊ณ ์์ต๋๋ค.
'์ธ๊ณต์ง๋ฅ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
| ์ธ์ฝ๋๋ง ์ฌ์ฉํ๋ BERT (0) | 2025.05.26 |
|---|---|
| ๐ ์ธ์ฝ๋(Encoder)์ ๋์ฝ๋(Decoder)๋? (0) | 2025.05.26 |
| ์ดํ ์ ์ ์ ํ 5๊ฐ์ง (0) | 2025.05.26 |
| seq2seq์ ์ดํ ์ ๋ฉ์ปค๋์ฆ์ ๊ฒฐํฉํ ๋ชจ๋ธ์ด ํธ๋์คํฌ๋จธ? (0) | 2025.05.26 |
| ์ดํ ์ ๋ฉ์ปค๋์ฆ๊ณผ Seq2Seq ๋ชจ๋ธ๊ณผ์ ๊ด๊ณ (0) | 2025.05.26 |