๐Ÿง  ์ธ์ฝ”๋”๋ž€?

**์ธ์ฝ”๋”(Encoder)**๋Š” ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ **์˜๋ฏธ ์žˆ๋Š” ๋ฒกํ„ฐ ํ‘œํ˜„(latent vector)**์œผ๋กœ ๋ฐ”๊พธ๋Š” ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค.
์ฃผ๋กœ ๊ณ ์ฐจ์› ์ž…๋ ฅ → ์ €์ฐจ์› ํŠน์„ฑ ๊ณต๊ฐ„์œผ๋กœ ์••์ถ•ํ•ฉ๋‹ˆ๋‹ค.


๐Ÿ“ฆ ์ธ์ฝ”๋”์˜ ์ฃผ์š” ์ข…๋ฅ˜

์ข…๋ฅ˜ ํŠน์ง• ๋Œ€ํ‘œ ๋ชจ๋ธ
CNN ์ธ์ฝ”๋” ์ด๋ฏธ์ง€์˜ ๊ณต๊ฐ„์  ํŠน์ง• ์ถ”์ถœ ResNet, ViT
RNN/LSTM ์ธ์ฝ”๋” ์‹œํ€€์Šค(๋ฌธ์žฅ, ์Œ์„ฑ) ์ฒ˜๋ฆฌ Seq2Seq, LSTM
Transformer ์ธ์ฝ”๋” Self-Attention ๊ธฐ๋ฐ˜, ๋ณ‘๋ ฌ ์ฒ˜๋ฆฌ BERT, ViT
Autoencoder ์ธ์ฝ”๋” ์••์ถ•ํ•˜์—ฌ ์žฌ๊ตฌ์„ฑ์šฉ ๋ฒกํ„ฐ ์ƒ์„ฑ AutoEncoder
Variational Encoder ํ™•๋ฅ  ๋ถ„ํฌ ๊ธฐ๋ฐ˜์˜ ๋ฒกํ„ฐ ์ƒ์„ฑ VAE (Variational AutoEncoder)

 

 

๐Ÿ” Variational Encoder (๋ณ€๋ถ„ ์ธ์ฝ”๋”)๋ž€?

Variational Encoder๋Š” **VAE(Variational AutoEncoder)**๋ผ๋Š” ์ƒ์„ฑ ๋ชจ๋ธ ์•ˆ์˜ ์ธ์ฝ”๋”์ž…๋‹ˆ๋‹ค.

๐Ÿงฌ VAE ๊ตฌ์กฐ ๊ฐ„๋‹จํžˆ

 
์ž…๋ ฅ ์ด๋ฏธ์ง€/ํ…์ŠคํŠธ
  ↓
[ Variational Encoder ]
  ↓
ํ™•๋ฅ  ๋ถ„ํฌ ํŒŒ๋ผ๋ฏธํ„ฐ (μ, σ)
  ↓
์ƒ˜ํ”Œ๋ง → ์ž ์žฌ ๋ฒกํ„ฐ z
  ↓
[ Decoder ]
  ↓
์žฌ๊ตฌ์„ฑ๋œ ์ถœ๋ ฅ

๐Ÿ“Œ Variational Encoder์˜ ์ฃผ์š” ํŠน์ง•

 

์š”์†Œ ์„ค๋ช…
์ž…๋ ฅ → ๋ถ„ํฌ ์ผ๋ฐ˜ ์ธ์ฝ”๋”๋Š” ๊ณ ์ •๋œ ๋ฒกํ„ฐ๋ฅผ ์ถœ๋ ฅํ•˜์ง€๋งŒ, ๋ณ€๋ถ„ ์ธ์ฝ”๋”๋Š” ๋ถ„ํฌ(μ, σ)๋ฅผ ์˜ˆ์ธกํ•จ
์ƒ˜ํ”Œ๋ง(Sampling) ์˜ˆ์ธก๋œ ๋ถ„ํฌ์—์„œ ๋žœ๋ค ์ƒ˜ํ”Œ z๋ฅผ ์ถ”์ถœํ•ด ๋””์ฝ”๋”๋กœ ์ „๋‹ฌํ•จ
์ •๊ทœํ™” ์ƒ˜ํ”Œ ๋ถ„ํฌ๊ฐ€ ์ •๊ทœ๋ถ„ํฌ์— ๊ฐ€๊น๋„๋ก ์œ ๋„(KL Divergence ํฌํ•จ)
ํ•™์Šต ๋ชฉํ‘œ ์ž…๋ ฅ์„ ์ž˜ ๋ณต์›ํ•˜๋ฉด์„œ๋„, ์ž ์žฌ ๊ณต๊ฐ„์„ ์—ฐ์†์ ์ด๊ณ  ์˜๋ฏธ ์žˆ๊ฒŒ ๋งŒ๋“ค๊ธฐ
 

๐ŸŽฏ ์™œ Variational Encoder๋ฅผ ์“ธ๊นŒ?

๋ชฉ์  ์ด์œ 
์ƒ์„ฑ๋ ฅ ๋ถ„ํฌ์—์„œ ์ƒ˜ํ”Œ์„ ๋ฝ‘๊ธฐ ๋•Œ๋ฌธ์— ๋‹ค์–‘ํ•œ ์ƒ์„ฑ ๊ฒฐ๊ณผ๋ฅผ ๋งŒ๋“ค ์ˆ˜ ์žˆ์Œ
๋ถ€๋“œ๋Ÿฌ์šด ์ž ์žฌ ๊ณต๊ฐ„ ์˜๋ฏธ ์žˆ๋Š” ๋ฒกํ„ฐ ๊ณต๊ฐ„ ๊ตฌ์กฐ๋ฅผ ๊ฐ€์ง€๋ฏ€๋กœ ๋ฒกํ„ฐ ๊ฐ„ ์ด๋™์ด ์ž์—ฐ์Šค๋Ÿฌ์›€
๋…ธ์ด์ฆˆ์— ๊ฐ•ํ•จ ํ™•๋ฅ ์  ํŠน์„ฑ ๋•๋ถ„์— ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์ด ์ข‹์Œ
 

๐Ÿ“š ์˜ˆ์‹œ: VAE๋กœ ์ˆซ์ž ์ƒ์„ฑํ•˜๊ธฐ (MNIST)

  1. ์†๊ธ€์”จ ์ˆซ์ž '3'์„ ์ธ์ฝ”๋”์— ๋„ฃ์Œ
  2. ์ธ์ฝ”๋”๊ฐ€ μ = [0.2, -0.5], σ = [0.1, 0.3]๋ฅผ ์ถœ๋ ฅ
  3. ์—ฌ๊ธฐ์„œ ์ž ์žฌ ๋ฒกํ„ฐ z๋ฅผ ์ƒ˜ํ”Œ๋ง
  4. ๋””์ฝ”๋”๊ฐ€ ์ด z๋ฅผ ๋ฐ›์•„ '3'์— ๊ฐ€๊นŒ์šด ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑ
  5. ํ•™์Šต์ด ์ง„ํ–‰๋˜๋ฉด, z ๊ณต๊ฐ„ ์•ˆ์—์„œ '0'~'9'๊ฐ€ ๊ฐ๊ฐ ์˜๋ฏธ ์žˆ๊ฒŒ ๋ฐฐ์น˜๋จ

โœ… ์ •๋ฆฌ ์š”์•ฝ

ํ•ญ๋ชฉ ์ผ๋ฐ˜ ์ธ์ฝ”๋” Variational ์ธ์ฝ”๋”
์ถœ๋ ฅ ๊ณ ์ •๋œ ๋ฒกํ„ฐ (latent) ํ™•๋ฅ  ๋ถ„ํฌ (μ, σ)
์ƒ์„ฑ ๋ฐฉ์‹ ์—†์Œ (๋ณต์›๋งŒ ๊ฐ€๋Šฅ) ์ƒ˜ํ”Œ๋ง ๊ธฐ๋ฐ˜ ์ƒ์„ฑ ๊ฐ€๋Šฅ
์‚ฌ์šฉ ๋ชจ๋ธ AutoEncoder, BERT ๋“ฑ VAE, GAN ์‘์šฉํ˜•
ํŠน์ง• ์••์ถ•/์š”์•ฝ์— ์ง‘์ค‘ ์ƒ์„ฑ์„ฑ๊ณผ ๋ถ„ํฌ ํ•™์Šต์— ์ดˆ์ 

+ Recent posts