[์ธ๊ณต์ง๋ฅ] SP09-Regularization
์ผ๋ฐํ(generalization) ์ฑ๋ฅ์ ๋์ด๋ ์ ๊ทํ ๋ฐฉ๋ฒ๋ค
Early stopping
๋งค iteration๋ง๋ค validation performance๋ฅผ ์ธก์ ํ์ฌ, ์ผ์ ๊ธฐ๊ฐ ๋์ ๊ฐ์ ์ด ์์ ์ ๊ณผ์ ํฉ๋๊ธฐ ์ ์ ํ์ต์ ์กฐ๊ธฐ ์ข ๋ฃํด์ฃผ๋ ๊ธฐ๋ฅ์ด๋ค.
Ensembling
์ฌ๋ฌ ๊ฐ์ ๋ชจ๋ธ์ ํ์ต์ํค๊ณ , ๊ทธ ์์ธก์ ๊ฒฐํฉํ์ฌ ์ต์ข ์์ธก์ ๋ง๋๋ ๋ฐฉ๋ฒ
๋ชจ๋ธ์ ๊ฒฐํฉํ ๋, regression ๋ฌธ์ ๋ output๋ค์ ํ๊ท ์ ์ฌ์ฉํ๊ณ classification ๋ฌธ์ ๋ softmax activation์ ๊ฑฐ์น๊ธฐ ์ ๊ฐ๋ค์ ํ๊ท ์ ์ฌ์ฉํ๋ค. ๋๋ค๋ฅธ ๋ฐฉ๋ฒ์ผ๋ก regression ๋ฌธ์ ๋ output๋ค์ ์ค์๊ฐ์ ์ฌ์ฉํ๊ณ classification ๋ฌธ์ ๋ ์ต๋น๊ฐ์ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ด ์๋ค.
๋ชจ๋ธ๋ณ๋ก ๋ค๋ฅธ ์ด๊ธฐ๊ฐ์ ์ฃผ๊ฑฐ๋, ๋ฐ์ดํฐ์ ์ re-samplingํ๊ฑฐ๋, ํ์ดํผ ํ๋ผ๋ฏธํฐ๋ฅผ ๋ฌ๋ฆฌํ๊ฑฐ๋, ๋ค๋ฅธ ์ ํ์ ๋ชจ๋ธ์ ํ์ต์ํค๋ ๋ฑ์ ๋ฐฉ๋ฒ์ผ๋ก ๋ชจ๋ธ ๊ฐ์ ์ฐจ์ด๋ฅผ ๋ง๋ค ์ ์๋ค.
Dropout
ํ์ต ๊ณผ์ ์์, ๋งค iteration๋ง๋ค ๋ฌด์์๋ก ํน์ ๋น์จ์ ๋ด๋ฐ์ ๋๋ ๋ฐฉ๋ฒ
kink๋ฅผ ์ ๋ฐํ๋ ํ์ต์ด ๋ ๋ unit์ ๋ฐ๊ฒฌํ ์ ์๊ณ , ํด๋น unit์ ํ์ต์ํค๋ฏ๋ก์จ ์ฑ๋ฅ์ ๊ฐ์ ์ํฌ ์ ์๋ค.
Transfer learning
์ด๋ฏธ ํ์ต๋ ๋ชจ๋ธ์ ์ผ๋ถ๋ฅผ ์๋ก์ด ๋ชจ๋ธ์ ์ฌ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ
secondary task๋ฅผ ํตํด ๋ด๋ถ์ ์ธ ๊ฐ๋ ์ ์ตํ๊ณ , original task์ ์ ์ฉํ๋ค.
๋ด๋ถ์ ๊ฐ๋ ์ ์ตํ ๋ชจ๋ธ๋ง์ ํ ํ์ ๋ง์ง๋ง layer์ ์ญ์ ํ๊ณ ํ ๊ฐ ์ด์์ layer๋ฅผ ์ถ๊ฐํ์ฌ original task์ ๋ง๋๋ก fine-tuningํ๋ค.
Multi-task learning
์ฌ๋ฌ task๋ฅผ ๋์์ ํ์ตํ์ฌ, ๊ฐ ์์ ์์ ์ป์ ์ง์์ ๊ณต์ ํ๋ ๋ฐฉ๋ฒ
์ด๋ ๊ฒ ๋์์ ํ์ต์ ํจ์ผ๋ก์จ ์ฑ๋ฅ์ด ๊ฐ์ ๋ ์ ์๋ค.
Self-supervised learning
๋ ์ด๋ธ์ด ์๋ ์ํ์์ ์ค์ค๋ก ํ์ตํ ์ ์๋ ๋ฐฉ๋ฒ
- Generative: ์ค์ค๋ก ๋ง์คํนํ๊ณ ๋ง์ถ๊ธฐ
์๋ฅผ ๋ค์ด ๋ชจ๋ธ์ด ์ค์ค๋ก ์ด๋ฏธ์ง์์ ๋๋คํ๊ฒ ์ผ๋ถ๋ถ์ ์ง์ฐ๊ณ , ๋ชจ๋ธ์ด ์ฑ์ฐ๋๋ก ํ๋ ๊ฒ์ด๋ค.
- Contrastive: ๊ณตํต์ ์ผ๋ก ๋น๊ตํ๊ธฐ
์๋ฅผ ๋ค์ด ์๋ก ์ด์ด์ง๋ ๋ฌธ์ฅ์ธ์ง ํ์ธํ๋ค.
Data augmentation
๊ธฐ์กด์ ํ์ต ๋ฐ์ดํฐ๋ฅผ ๋ณํํ์ฌ ์๋ก์ด ํ์ต ๋ฐ์ดํฐ๋ฅผ ํ์ฑํ๋ ๋ฐฉ๋ฒ
์ด๋ฅผ ํตํด ๋ชจ๋ธ์ด ๋ฐ์ดํฐ์ ๋ค์ํ ๋ณํ์ ๋ํด ์ผ๋ฐํํ๋ ๋ฅ๋ ฅ์ ํฅ์์ํฌ ์ ์๋ค. ์๋ฅผ ๋ค์ด, ๋์์ด๋ ๋ค๋ฅธ ์ธ์ด๋ก ๋ฒ์ญํ ํ ๋ค์ ๋ฒ์ญํ์์ ๋ ์ผ์นํ๋ ์ง ํ์ธํ๋ ๋ฐฉ๋ฒ์ด ์๋ค.