Week 1. AI์ ์ธ๊ณ
์ธ๊ณต์ง๋ฅ์ด๋ผ๋ ํฐ ์ฒ์ ํ ๋ฐํด ๋๋ฌ๋ณด๊ณ , ๊ฐ์ฅ ๋จ์ํ์ง๋ง ๊ฐ๋ ฅํ ๋ถ๋ฅ๊ธฐ๋ฅผ ์ง์ ์์ผ๋ก ๊ตด๋ ค๋ด ๋๋ค.
์ด๋ฒ ์ฃผ์ ๋ฐฐ์ฐ๋ ๊ฒ
- AI ยท ML ยท DL์ ํฌํจ ๊ด๊ณ
- ์ง๋ํ์ต๊ณผ ๋น์ง๋ํ์ต, ๋ถ๋ฅ์ ํ๊ท
- ๊ฐ์ฅ ๋จ์ํ ๋ถ๋ฅ๊ธฐ: K-์ต๊ทผ์ ์ด์ (KNN)
- ๊ฑฐ๋ฆฌ ์ฒ๋: ์ ํด๋ฆฌ๋ vs ๋งจํดํผ
- scikit-learn ์ฝ๋ ํ ์ค ์ฒดํ
- 13์ฃผ์ฐจ ์ ์ฒด ๋ก๋๋งต
0. ๋ค์ด๊ฐ๋ฉฐ โ ์ ํํ ์ง๊ธ AI์ธ๊ฐ
์ธ๊ณต์ง๋ฅ์ด๋ผ๋ ๋ง์ 1956๋ ๋คํธ๋จธ์ค ํ์์์ ์ฒ์ ๊ณต์ํ๋์ต๋๋ค. ์กด ๋งค์นด์, ๋ง๋น ๋ฏผ์คํค, ํด๋ก๋ ์๋ ๊ฐ์ ์ ์ค์ ์ธ๋ฌผ๋ค์ด "์๊ฐํ๋ ๊ธฐ๊ณ๋ฅผ ๋ง๋ค ์ ์๋ค"๊ณ ์ ์ธํ ๊ทธ ์ฌ๋ฆ์ ๋๊ด๋ก ์, ์ดํ 70๋ ๊ฐ ๋ ๋ฒ์ "AI ๊ฒจ์ธ"์ ๊ฒช์ต๋๋ค. 1970๋ ๋์๋ ๊ธฐํธ์ฃผ์(symbolic AI)๊ฐ ํ์ค ์ธ๊ณ์ ๋ชจํธํจ์ ๊ฐ๋นํ์ง ๋ชปํด ๋ฌด๋์ก๊ณ , 1980๋ ๋ ๋ง ์ ๋ฌธ๊ฐ ์์คํ ์ ์ ์ง๋น์ฉ์ด ํญ๋ฐํ๋ฉด์ ๋ ๋ฒ์งธ ๊ฒจ์ธ์ด ์์ต๋๋ค. ์ ๊ฒฝ๋ง๋ ์์ธ๊ฐ ์๋์ด์, 1969๋ ๋ฏผ์คํค-ํํผํธ์ Perceptrons ์ฑ ์ด ๋จ์ธต ํผ์ ํธ๋ก ์ XOR ํ๊ณ๋ฅผ ์ง์ ํ์ ์ฐ๊ตฌ๋น๊ฐ ๋๊ฒผ๊ณ , 1990๋ ๋์๋ SVM๊ณผ ๊ฐ์ ๋ ์ํ์ ์ผ๋ก ๊น๋ํ ๋ฐฉ๋ฒ์ด ์ฃผ๋ฅ๋ฅผ ์ฐจ์งํ๋ฉฐ ์ ๊ฒฝ๋ง์ ์ฌ์ค์ ๋ณ๋ฐฉ์ผ๋ก ๋ฐ๋ ค๋ฌ์ต๋๋ค.
๋ฐ์ ์ 2012๋ ImageNet ๋ํ์์ ์ผ์ด๋ฌ์ต๋๋ค. ํ ๋ก ํ ๋ํ ์ ํ๋ฆฌ ํํผ์ ์ ์ ์๋ ์ค ํฌ๋ฆฌ์ ๋ธ์คํค๊ฐ ๋ง๋ AlexNet์ ๊ธฐ์กด ์ต๊ณ ์ฑ๋ฅ๋ณด๋ค ์ค๋ฅ์จ์ 10%p ๋๊ฒ ๋จ์ด๋จ๋ฆฌ๋ฉฐ ์ฐ์นํ์ต๋๋ค. 5๊ฐ์ ์ปจ๋ณผ๋ฃจ์ ์ธต๊ณผ 3๊ฐ์ ์์ ์ฐ๊ฒฐ ์ธต, ์ด 6000๋ง ๊ฐ์ ํ๋ผ๋ฏธํฐ๋ฅผ ๋ ๊ฐ์ GTX 580 GPU๋ก ์ผ์ฃผ์ผ ๊ฐ๊น์ด ํ์ต์ํจ ์ด ๋ชจ๋ธ์ ReLU, ๋๋กญ์์, ๋ฐ์ดํฐ ์ฆ๊ฐ ๊ฐ์ ์ง๊ธ๋ ์ฐ๋ฆฌ๊ฐ ์ฐ๋ ๊ธฐ๋ณธ ๋๊ตฌ๋ค์ ํ๊บผ๋ฒ์ ๋ณด์ฌ์คฌ์ต๋๋ค. ์ด ์ฌ๊ฑด์ ๋จ์ํ ํ ๋ํ์ ์ฐ์น์ ๋์ด, "๊น์ ์ ๊ฒฝ๋ง์ด ์ง์ง๋ก ์๋ํ๋ค"๋ ์ฆ๊ฑฐ๋ฅผ ์ ๊ณ์ ๋์ก๊ณ ์ง๊ธ์ ๋ฅ๋ฌ๋ ๋ฅด๋ค์์ค๊ฐ ์์๋์ต๋๋ค.
์ฐ๋ฆฌ๊ฐ ์ธ ๋ฒ์งธ AI ๊ฒจ์ธ์ ํผํ ์ด์ ๋ ์ธ ๊ฐ์ง๊ฐ ํ๊บผ๋ฒ์ ์ฑ์ํ๊ธฐ ๋๋ฌธ์ ๋๋ค โ ์ธํฐ๋ท๊ณผ ์ค๋งํธํฐ์ด ์์๋ธ ๋ฐ์ดํฐ, GPU์ TPU๊ฐ ๋ง๋ค์ด๋ธ ๊ณ์ฐ๋ ฅ, ๊ทธ๋ฆฌ๊ณ ReLUยท๋ฐฐ์น์ ๊ทํยทAdam ๊ฐ์ ์๊ณ ๋ฆฌ์ฆ ํ์ . ํ ํ๊ธฐ ๋์ ์ฐ๋ฆฌ๊ฐ ๋ฐฐ์ฐ๋ ๋ชจ๋ ์ฃผ์ ๋ ์ด ์ธ ๊ธฐ๋ฅ ์์ ์ ์๋ค๊ณ ๋ณด๋ฉด ๋ฉ๋๋ค.
1. AI ยท ML ยท DL โ ํท๊ฐ๋ฆฌ๋ ์ธ ๋จ์ด
๋ด์ค์์ ๋งค์ผ ๋ฃ์ง๋ง ๋ง์ ์ฐจ์ด๋ฅผ ์ค๋ช ํ๋ผ๊ณ ํ๋ฉด ๋ง๋งํฉ๋๋ค. ์ฌ์ค์ ํฌํจ ๊ด๊ณ์ ๋๋ค.
- AI (์ธ๊ณต์ง๋ฅ) โ ์ฌ๋์ฒ๋ผ ์๊ฐํ๊ฑฐ๋ ํ๋ํ๋ ๋ชจ๋ ๊ธฐ๊ณ. ๊ฐ์ฅ ํฐ ๊ฐ๋ . 1950๋ ๋๋ถํฐ ์์๋ ์ค๋๋ ๋จ์ด๋ก, ๊ท์น ๊ธฐ๋ฐ ์ ๋ฌธ๊ฐ ์์คํ ๋ AI์ ๋๋ค.
- ML (๋จธ์ ๋ฌ๋) โ ์ฌ๋์ด ๊ท์น์ ์ผ์ผ์ด ์ง๋ ๋์ ๋ฐ์ดํฐ์์ ๊ท์น์ ์๋์ผ๋ก ๋ฐฐ์ฐ๋ ๋ฐฉ๋ฒ. AI์ ํ ๊ฐ๋์ ๋๋ค.
- DL (๋ฅ๋ฌ๋) โ ๋ค์ธต ์ ๊ฒฝ๋ง์ ์ฌ์ฉํ๋ ๋จธ์ ๋ฌ๋์ ํ ๊ฐ๋. 2012๋ ImageNet ๋ํ ์ดํ ํญ๋ฐ์ ์ผ๋ก ์ฑ์ฅํ์ต๋๋ค.
์ฆ AI โ ML โ DL. ์ด๋ฒ ํ๊ธฐ์๋ ๊ฐ์ด๋ฐ์ ๊ฐ์ฅ ์์ชฝ ๋๊ทธ๋ผ๋ฏธ๋ฅผ ๋ณธ๊ฒฉ์ ์ผ๋ก ๋ค๋ฃน๋๋ค.
๊ตฌ์ฒด์ ์ธ ์๋ก ์ดํดํ๋ฉด ๋ ์ ๋ช ํฉ๋๋ค. "์ฒด์ค ํ๋ก๊ทธ๋จ"์ ๋ง๋ ๋ค๊ณ ํฉ์๋ค. 1990๋ ๋์ ๋ฅ๋ธ๋ฃจ๋ ์ฌ๋์ด ์์ผ๋ก ํ๊ฐ ํจ์๋ฅผ ์ง๊ณ ์ํ-๋ฒ ํ ํ์์ผ๋ก ์๋ฅผ ์ฝ๋ ๊ท์น ๊ธฐ๋ฐ AI์์ต๋๋ค โ ML์ด ์๋๋๋ค. 2000๋ ๋์ ์คํธ ํํฐ๋ "๋จ์ด์ ๋น๋๋ฅผ ํผ์ฒ๋ก ์ฐ๊ณ ๋ก์ง์คํฑ ํ๊ท๋ก ๋ถ๋ฅ"ํ๋ ๋ฐฉ์์ผ๋ก, ์ฌ๋์ด ํผ์ฒ๋ ์ค๊ณํ์ง๋ง ๊ฐ์ค์น๋ ๋ฐ์ดํฐ๊ฐ ๊ฒฐ์ ํ๋ ML์ ๋๋ค. 2016๋ ์ ์ํ๊ณ ๋ ์ฌ๋์ด ํผ์ฒ์กฐ์ฐจ ์ค๊ณํ์ง ์๊ณ , ๋ฐ๋ํ ์ด๋ฏธ์ง๋ฅผ ํต์งธ๋ก ๋ฃ์ด ์ปจ๋ณผ๋ฃจ์ ์ ๊ฒฝ๋ง์ด ์ค์ค๋ก "์ข์ ์"์ ํจํด์ ์ฐพ๊ฒ ํ๋ DL์ ๋๋ค. ๊ฐ์ ๋ฌธ์ ๋ ์ด๋ ์ธต์์ ์ ๊ทผํ๋๋์ ๋ฐ๋ผ ๋ค๋ฅธ ๊ธฐ์ ์ด ๋ฉ๋๋ค.
์ด๋ณด์๊ฐ ์์ฃผ ์คํดํ๋ ๊ฒ์ "๋ฅ๋ฌ๋์ ํญ์ ๋จธ์ ๋ฌ๋๋ณด๋ค ๋ซ๋ค"์ ๋๋ค. ์ฌ์ค์ ๋ฐ๋์ ๊ฐ๊น์ต๋๋ค. ๋ฐ์ดํฐ๊ฐ ์๋ฐฑยท์์ฒ ๊ฑด์ ๋ถ๊ณผํ๊ฑฐ๋, ํด์ ๊ฐ๋ฅ์ฑ์ด ์ค์ํ๊ฑฐ๋(์๋ฃ ์ง๋จ ๊ทผ๊ฑฐ ์ ์), ์ฃ์ง ๋๋ฐ์ด์ค์์ ๋๋ ค์ผ ํ๋ค๋ฉด ๋๋คํฌ๋ ์คํธ๋ ๋ก์ง์คํฑ ํ๊ท๊ฐ ๋ ๋์ ์ ํ์ผ ๋๊ฐ ์์ฃผ ๋ง์ต๋๋ค. ๋ฅ๋ฌ๋์ ์ง์ง ๊ฐ์ ์ ๋ฐ์ดํฐ๊ฐ ์์ญ๋ง ๊ฑด ์ด์์ด๊ณ ํผ์ฒ ์์ง๋์ด๋ง์ด ์ด๋ ค์ด ์์ญ(์ด๋ฏธ์ง, ์์ฑ, ์์ฐ์ด)์์ ๋๋ฌ๋ฉ๋๋ค.
2. ์ง๋ํ์ต vs ๋น์ง๋ํ์ต
๋จธ์ ๋ฌ๋์ ๋ถ๋ฅํ๋ ๊ฐ์ฅ ํํ ์ถ์ "์ ๋ต์ด ์๋๋"์ ๋๋ค. ์ ๋ต์ด ์์ผ๋ฉด ์ง๋ํ์ต, ์์ผ๋ฉด ๋น์ง๋ํ์ต์ ๋๋ค. ์ด ๊ตฌ๋ถ์ ๋จ์ํด ๋ณด์ด์ง๋ง ์ค์ ์์๋ ๋ฐ์ดํฐ๋ฅผ ๋ชจ์ผ๋ ๋น์ฉ์ ๊ตฌ๋ถ์ด๊ธฐ๋ ํฉ๋๋ค. ๋ผ๋ฒจ๋ง์ ๋๊ฐ ์ฌ๋์ ์์ด ํ์ํ๊ณ , ์๋ฃ์์์ฒ๋ผ ์ ๋ฌธ๊ฐ๊ฐ ํ์ํ ๊ฒฝ์ฐ ์ด๋ฏธ์ง ํ ์ฅ๋น ์๋ง ์์ด ๋ค๊ธฐ๋ ํฉ๋๋ค. ๋ฐ๋ฉด ๋ผ๋ฒจ์ด ์๋ ๋ฐ์ดํฐ๋ ์ธํฐ๋ท์ ๋ฌดํํ ์์ต๋๋ค. ๊ทธ๋์ ์์ฆ LLM๋ค์ด ์ฌ์ฉํ๋ ์๊ธฐ์ง๋ํ์ต(self-supervised)์ "๋ผ๋ฒจ ์๋ ๋ฐ์ดํฐ์์ ์ธ์์ ์ธ ์ ๋ต์ ๋ง๋ค์ด๋ด" ์ง๋ํ์ต์ฒ๋ผ ํ๋ จํ๋ ์ ๊ทผ์ธ๋ฐ, ์ด ์ด์ผ๊ธฐ๋ W13 ํธ๋์คํฌ๋จธ์ LLM์์ ๋ค์ ๋ง๋ฉ๋๋ค.
| ๋ถ๋ฅ | ์ ๋ ฅ | ์์ |
|---|---|---|
| ์ง๋ํ์ต (Supervised) | ์ ๋ ฅ + ์ ๋ต ๋ผ๋ฒจ | ๋๋ฏธ/๋น์ด ๋ถ๋ฅ, ์ง๊ฐ ์์ธก, ๋ฉ์ผ ์คํธ ํ์ |
| ๋น์ง๋ํ์ต (Unsupervised) | ์ ๋ ฅ๋ง | ๊ณ ๊ฐ ๊ตฐ์งํ, ์ฐจ์ ์ถ์, ์ด์์น ํ์ง |
| ๊ฐํํ์ต (Reinforcement) | ์ํ + ๋ณด์ | ์ํ๊ณ , ๋ก๋ด ๋ณดํ, ๊ฒ์ AI |
์ง๋ํ์ต์ ๋ค์ ๋ ์ข ๋ฅ๋ก ๋๋ฉ๋๋ค.
- ๋ถ๋ฅ (Classification) โ ์นดํ ๊ณ ๋ฆฌ๋ฅผ ์์ธก. "์ด๊ฑด ๋๋ฏธ? ๋น์ด?" ์ถ๋ ฅ์ด ์ด์ฐ์ ์ ๋๋ค.
- ํ๊ท (Regression) โ ์ฐ์๋ ์ซ์๋ฅผ ์์ธก. "์ด ๋์ด์ ๋ฌด๊ฒ๋ ๋ช g?" ์ถ๋ ฅ์ด ์ค์์ ๋๋ค.
๐ฎ ์ธํฐ๋ํฐ๋ธ: ์ง๋/๋น์ง๋ ๋ฐ์ดํฐ ์์ฑ๊ธฐ
ํด๋ฌ์คํฐ ์์ ๋ถ์ฐ์ ์กฐ์ ํด ๋ฐ์ดํฐ๋ฅผ ์์ฑํฉ๋๋ค. "๋ผ๋ฒจ ๋ณด์ด๊ธฐ"๋ฅผ ๋๋ฉด ๋น์ง๋ํ์ต ์ ์ฅ์์ ๋ณธ ๋ฐ์ดํฐ์ ๋๋ค โ ์์ด ์์ผ๋ ๊ทธ์ ์ ๋ฌด๋๊ธฐ์ฃ .
3. K-Nearest Neighbors (KNN)
KNN์ 1951๋ Fix์ Hodges๊ฐ ๋ฐํํ, ๋จธ์ ๋ฌ๋์ ๊ฐ์ฅ ์๋ก ์๊ณ ๋ฆฌ์ฆ ์ค ํ๋์ ๋๋ค. "๋น์ทํ ๊ฒ์ ๋น์ทํ ๋ต์ ๊ฐ์ง ๊ฒ์ด๋ค"๋ผ๋ ๋๋ฌด๋ ๋น์ฐํ ๊ฐ์ ์์ ์ถ๋ฐํฉ๋๋ค. ์ฌ๋ฏธ์๋ ์ ์ KNN์๋ ์ฌ์ค ํ์ต ๋จ๊ณ๊ฐ ์๋ค๋ ๊ฒ์ ๋๋ค. ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ๊ทธ๋๋ก ์ ์ฅํด๋๊ธฐ๋ง ํ ๋ฟ์ด๊ณ , ๋ชจ๋ ๊ณ์ฐ์ ์์ธก ์์ ์ ์ผ์ด๋ฉ๋๋ค. ์ด๋ฐ ๋ฐฉ์์ ๊ฒ์ผ๋ฅธ ํ์ต(lazy learning)์ด๋ผ๊ณ ๋ถ๋ฆ ๋๋ค. ๋๋น๋๋ eager learning(์: ์ ๊ฒฝ๋ง)์ ํ์ต ๋ ๋ง์ ์๊ฐ์ ์ฐ๊ณ ์์ธก์ ๋น ๋ฅธ๋ฐ, KNN์ ์ ๋ฐ๋๋ผ ์ค์๊ฐ ์์ธก์ด ํ์ํ ์ํฉ์์๋ ์คํ๋ ค ๋ถ๋ฆฌํ ์ ์์ต๋๋ค.
์์ฃผ ์์ ์๋ก ๊ฐ์ ์ก์๋ด ์๋ค. ํ๋ จ ๋ฐ์ดํฐ๊ฐ ์ธ ์ ์ด๋ผ ํฉ์๋ค: A=(1,1, ๋๋ฏธ), B=(2,2, ๋๋ฏธ), C=(5,5, ๋น์ด). ์ ์ X=(3,3)์ K=1๋ก ๋ถ๋ฅํ๋ฉด, ๊ฐ์ฅ ๊ฐ๊น์ด ์ ์ B(๊ฑฐ๋ฆฌ $\sqrt{2}$)์ด๋ฏ๋ก ๋๋ฏธ๋ก ๋ถ๋ฅ๋ฉ๋๋ค. K=3์ด๋ฉด ์ธ ์ ๋ชจ๋ ๊ณ ๋ คํด ๋ค์๊ฒฐ์ธ๋ฐ, ๋๋ฏธ 2 vs ๋น์ด 1์ด๋ผ ์ฌ์ ํ ๋๋ฏธ์ ๋๋ค. ์ด๋ ๊ฒ ์์ผ๋ก ๋ฐ๋ผ๊ฐ ๋ณด๋ฉด "ํ์ต์ด ์๋ค"๋ ๋ง์ ์๋ฏธ๊ฐ ๋ถ๋ช ํด์ง๋๋ค โ ์ฐ๋ฆฌ๋ ์๋ฌด ๊ฐ์ค์น๋ ์ ๋ฐ์ดํธํ์ง ์์์ต๋๋ค.
๊ฐ์ฅ ๋จ์ํ๊ณ ์ง๊ด์ ์ธ ๋ถ๋ฅ๊ธฐ์ ๋๋ค. ํ์ต์ด๋ผ ํ ๋งํ ๊ฒ ์์ต๋๋ค โ ๊ทธ๋ฅ ๋ฐ์ดํฐ๋ฅผ ํต์งธ๋ก ์ธ์๋ ๋ฟ. ์ ๋ฐ์ดํฐ๊ฐ ๋ค์ด์ค๋ฉด:
- ํ์ต ๋ฐ์ดํฐ ์ค ๊ฐ์ฅ ๊ฐ๊น์ด K๊ฐ์ ์ด์์ ์ฐพ์ต๋๋ค.
- ๊ทธ K๊ฐ์ ํด๋์ค๋ฅผ ๋ณด๊ณ ๋ค์๊ฒฐ๋ก ๊ฒฐ์ ํฉ๋๋ค.
$N_K(\mathbf{x})$๋ $\mathbf{x}$์ K๊ฐ ์ต๊ทผ์ ์ด์, $\mathbb{1}$์ ์กฐ๊ฑด์ด ์ฐธ์ด๋ฉด 1์ ๋๋ค. ๊ฑฐ๋ฆฌ๋ ๋ณดํต ์ ํด๋ฆฌ๋ ๊ฑฐ๋ฆฌ๋ฅผ ์๋๋ค.
$$ d_{\text{Euclid}}(\mathbf{x},\mathbf{y}) = \sqrt{\sum_i (x_i - y_i)^2}, \quad d_{\text{Manhattan}}(\mathbf{x},\mathbf{y}) = \sum_i |x_i - y_i| $$๐ฎ ์ธํฐ๋ํฐ๋ธ: KNN ๊ฒฐ์ ๊ฒฝ๊ณ
๋๋ฏธ(ํ๋)์ ๋น์ด(์ฃผํฉ) ๋ฐ์ดํฐ์ ๋๋ค. K๋ฅผ ์กฐ์ ํ๋ฉฐ ๊ฒฐ์ ๊ฒฝ๊ณ๊ฐ ์ด๋ป๊ฒ ๋ณํ๋์ง ๋ณด์ธ์. ์บ๋ฒ์ค๋ฅผ ํด๋ฆญํด ์ ๋ฐ์ดํฐ๋ฅผ ์ถ๊ฐํ ์ ์๊ณ , ์ฐํด๋ฆญ์ ๋น์ด์ ๋๋ค.
4. ๊ฑฐ๋ฆฌ ์ฒ๋ ๋น๊ต
"๊ฐ๊น๋ค"์ ์ ์๋ ํ ๊ฐ์ง๊ฐ ์๋๋๋ค. ์ ํด๋ฆฌ๋๋ ์ง์ ๊ฑฐ๋ฆฌ, ๋งจํดํผ์ ๋์ ๋ธ๋ก์ ๋ฐ๋ผ๊ฐ๋ ๊ฑฐ๋ฆฌ์ ๋๋ค. ์ฐจ์์ด ๋์์ง์๋ก ๋ ๊ฑฐ๋ฆฌ์ ์ฐจ์ด๊ฐ ์ปค์ง๋๋ฐ, ์ด๋ฅผ ์ฐจ์์ ์ ์ฃผ๋ผ๊ณ ๋ ํฉ๋๋ค.
๐ฎ ์ธํฐ๋ํฐ๋ธ: ์ ํด๋ฆฌ๋ vs ๋งจํดํผ
์ค์ฌ์ ์์ ๊ฐ์ ๊ฑฐ๋ฆฌ์ ์๋ ์ ๋ค์ ์งํฉ(=๋ฑ๊ฑฐ๋ฆฌ์)์ ๊ทธ๋ฆฝ๋๋ค. ์ ํด๋ฆฌ๋๋ ๋๊ทธ๋ ์์ด์ง๋ง ๋งจํดํผ์ ๋ง๋ฆ๋ชจ(์ ์ฌ๊ฐํ ํ์ )์ ๋๋ค.
๊ธฐํํ์ ์ผ๋ก ์๊ฐํ๋ฉด, ๊ฑฐ๋ฆฌ ์ฒ๋๋ฅผ ๋ฐ๊พผ๋ค๋ ๊ฒ์ "๊ฐ์ ๊ฑฐ๋ฆฌ"์ ์๋ฏธ๋ฅผ ๋ฐ๊พธ๋ ์ผ์ ๋๋ค. ์ ํด๋ฆฌ๋์์๋ ๋ฑ๊ฑฐ๋ฆฌ ์งํฉ์ด ์์ด๊ณ , ๋งจํดํผ์์๋ 45๋ ํ์ ํ ์ ์ฌ๊ฐํ(๋ง๋ฆ๋ชจ), ์ฒด๋น์ ฐํ($L_\infty$)์์๋ ์ ์ฌ๊ฐํ์ด ๋ฉ๋๋ค. ๋ ์ผ๋ฐํํ ๋ฏผ์ฝํ์คํค ๊ฑฐ๋ฆฌ $d_p(\mathbf x,\mathbf y)=(\sum |x_i-y_i|^p)^{1/p}$๋ $p$์ ๋ฐ๋ผ ๋ชจ์์ด ๋ถ๋๋ฝ๊ฒ ๋ฐ๋๋๋ค. $p=2$๊ฐ ๊ฐ์ฅ ํํ ์ด์ ๋ ํ์ ์ ๋ถ๋ณ์ด๋ผ์ ์ขํ๊ณ๋ฅผ ๋ฐ๊ฟ๋ ๊ฒฐ๊ณผ๊ฐ ๊ฐ๊ธฐ ๋๋ฌธ์ ๋๋ค.
5. ์ฝ๋ ์์ (scikit-learn)
# ๋๋ฏธ(0) vs ๋น์ด(1) ๋ถ๋ฅ
from sklearn.neighbors import KNeighborsClassifier
# ๊ธธ์ด(cm), ๋ฌด๊ฒ(g)
fish_data = [[25.4, 242], [26.3, 290], [26.5, 340], [29.0, 363],
[9.8, 6.7], [10.5, 7.5], [10.6, 7.0], [11.0, 9.7]]
fish_label = [0, 0, 0, 0, 1, 1, 1, 1]
kn = KNeighborsClassifier(n_neighbors=3)
kn.fit(fish_data, fish_label)
print(kn.predict([[30, 600]])) # โ [0] (๋๋ฏธ)
print(kn.score(fish_data, fish_label)) # โ 1.0
scikit-learn์ 2007๋
David Cournapeau๊ฐ ์์ํ ํ์ด์ฌ ๋จธ์ ๋ฌ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก, "๋ชจ๋ ๋ชจ๋ธ์ด fitยทpredictยทscore๋ผ๋ ๋์ผํ ์ธํฐํ์ด์ค๋ฅผ ๊ณต์ ํ๋ค"๋ ์ฒ ํ์ด ํต์ฌ์
๋๋ค. ๋๋ถ์ KNN์ ๋๋คํฌ๋ ์คํธ๋ก ๋ฐ๊ฟ ๋ ํ ์ค๋ง ๊ณ ์น๋ฉด ๋ฉ๋๋ค. ์ฐ๋ฆฌ๋ ํ๊ธฐ ๋ด๋ด ์ด ์ธํฐํ์ด์ค๋ฅผ ๊ธฐ์ค์ ์ผ๋ก ์ผ๊ณ , ๋ฅ๋ฌ๋์ผ๋ก ๋์ด๊ฐ๋ฉด PyTorch์ forward/backward ์คํ์ผ๋ก ์์ฐ์ค๋ฝ๊ฒ ์งํํด ๊ฐ ๊ฒ์
๋๋ค.
n_neighbors๋ ๋ณดํต 3~15 ์ฌ์ด์์ ๊ต์ฐจ๊ฒ์ฆ์ผ๋ก ๊ณ ๋ฆ
๋๋ค. ๋ฐ์ดํฐ๊ฐ ๋ง์ผ๋ฉด(์๋ง ๊ฑด ์ด์) ๊ฑฐ๋ฆฌ ๊ณ์ฐ์ด $O(N)$์ด๋ผ ์์ธก์ด ๋๋ ค์ง๋ฏ๋ก algorithm='ball_tree'๋ 'kd_tree'๋ก ๊ฐ์ํ๊ฑฐ๋, ๊ทผ์ฌ ์ต๊ทผ์ ์ด์(FAISS, Annoy)์ ์๋๋ค. ๊ฑฐ๋ฆฌ ๊ธฐ๋ฐ ๊ฐ์ค ํฌํ(weights='distance')๋ ๊ฐ๊น์ด ์ด์์ ๋ ํฐ ํ๋ฅผ ์ฃผ๋๋ฐ, ๊ฒฝ๊ณ๊ฐ ๋ณต์กํ ๋ฐ์ดํฐ์์ ํจ๊ณผ๊ฐ ์ข์ต๋๋ค.6. 13์ฃผ ์ ์ฒด ๋ก๋๋งต
์ด๋ฒ ํ๊ธฐ ์ฐ๋ฆฌ๋ ๋ฐ์ดํฐ ๋ค๋ฃจ๊ธฐ๋ถํฐ ์์ํด ํ๊ทยท๋ถ๋ฅยท์ ๊ฒฝ๋งยทCNNยทRNN์ ๊ฑฐ์ณ ํธ๋์คํฌ๋จธ์ ๋ํ ์ธ์ด ๋ชจ๋ธ๊น์ง ๊ฐ๋๋ค. ๊ฐ ์นด๋๋ฅผ ๋๋ฌ ํด๋น ์ฃผ์ฐจ๋ก ๋ฐ๋ก ์ด๋ํ ์ ์์ต๋๋ค.
๋ฐ์ดํฐ ํธ๋ค๋ง
๋ชจ๋ธ๋ณด๋ค ๋ฐ์ดํฐ๊ฐ ๋จผ์ ์ ๋๋ค. NumPy ๋ฐฐ์ด, pandas ๋ฐ์ดํฐํ๋ ์, ํ์คํ์ ์ ๊ทํ, ํ์ต/๊ฒ์ฆ/ํ ์คํธ ๋ถํ ๊น์ง โ ๋จธ์ ๋ฌ๋ ํ์ดํ๋ผ์ธ์ ์ ๋ฐ์ ์ฌ๊ธฐ์ ๋๋ฉ๋๋ค.
Week 3ํ๊ท 1: ์ ํํ๊ท
๊ฐ์ฅ ๋จ์ํ ๋ชจ๋ธ๋ก ์ง์ ์ ๋ฐ์ดํฐ์ ๋ง์ถฅ๋๋ค. ๋น์ฉํจ์(MSE)์ ๊ฒฝ์ฌํ๊ฐ๋ฒ์ด๋ผ๋ ๋ ๋๊ตฌ๋ก "ํ์ต"์ด ๋ฌด์์ธ์ง ์ฒ์ ๋ง์ง๊ฒ ๋ฉ๋๋ค.
Week 4ํ๊ท 2: ๋ค์คํ๊ท์ ๋ก์ง์คํฑ
์ ๋ ฅ์ด ์ฌ๋ฌ ๊ฐ์ธ ๋ค์คํ๊ท, 0/1์ ์์ธกํ๋ ๋ก์ง์คํฑ ํ๊ท, ๊ทธ๋ฆฌ๊ณ ์ฌ๋ฌ ํด๋์ค๋ฅผ ๋ค๋ฃจ๋ ์ํํธ๋งฅ์ค. ๋ถ๋ฅ์ ํ๊ท์ ๋ค๋ฆฌ๋ฅผ ๋์ต๋๋ค.
Week 5๋ถ๋ฅ ์๊ณ ๋ฆฌ์ฆ
KNN์ ๋ ๊น์ด ๋ณด๊ณ , ๋ง์ง์ ์ต๋ํํ๋ SVM, ์ง๋ฌธ์ ๊ฐ์ง์น๋ ๊ฒฐ์ ํธ๋ฆฌ, ๋๋ฌด ์ฌ๋ฌ ๊ทธ๋ฃจ๋ฅผ ๋ชจ์ ๋๋คํฌ๋ ์คํธ๊น์ง. ๊ณ ์ ๋จธ์ ๋ฌ๋์ ํต์ฌ ๋๊ตฌ์์์ ๋๋ค.
Week 6๋น์ง๋ํ์ต
๋ผ๋ฒจ ์์ด ๋ฐ์ดํฐ์ ๊ตฌ์กฐ๋ฅผ ์ฐพ์ต๋๋ค. K-ํ๊ท ๊ตฐ์งํ, ๋ฐ๋ ๊ธฐ๋ฐ DBSCAN, ๊ทธ๋ฆฌ๊ณ ์ฐจ์์ ์ค์ด๋ PCA. "์ธ์์ ๋จ์ํ๊ฒ ๋ณด๋ ๋ฒ"์ ๋ฐฐ์๋๋ค.
Week 7ํผ์ ํธ๋ก ๊ณผ MLP
์ ๊ฒฝ๋ง์ ์์. XOR ๋ฌธ์ ๋ก ํ ๋ฒ ์ฃฝ์๋ ํผ์ ํธ๋ก ์ด ๋ค์ธต ๊ตฌ์กฐ์ ํ์ฑํจ์๋ก ๋ถํํ๋ ์ด์ผ๊ธฐ. ๋น์ ํ์ฑ์ด ์ ๊ทธ๋ ๊ฒ ์ค์ํ์ง ์๊ฒ ๋ฉ๋๋ค.
Week 8์ฌ์ธต์ ๊ฒฝ๋ง๊ณผ ์ญ์ ํ
์ธต์ด ๊น์ด์ง๋ฉด ์ด๋ป๊ฒ ํ์ตํ ๊น? ์ฐ์๋ฒ์น์ผ๋ก ํ์ด๋ด๋ ์ญ์ ํ, ์ฌ๋ผ์ง๋ ๊ธฐ์ธ๊ธฐ, ReLUยท๋๋กญ์์ยท๋ฐฐ์น์ ๊ทํ ๊ฐ์ ํ๋ ๋ฅ๋ฌ๋์ ํ ๋๋ค.
Week 9CNN ๊ธฐ์ด
์ด๋ฏธ์ง๋ฅผ ์ํ ์ ๊ฒฝ๋ง. ํฉ์ฑ๊ณฑ์ด๋ผ๋ ๋จ์ํ ์ฐ์ฐ์ด ์ด๋ป๊ฒ ๋ชจ์๋ฆฌยท์ง๊ฐยท๋ฌผ์ฒด๋ฅผ ์ฐจ๋ก๋ก ์ฐพ์๋ด๋์ง, ๊ทธ๋ฆฌ๊ณ LeNet์ด๋ผ๋ ์ฒซ ์ฑ๊ณต ์ฌ๋ก๊น์ง.
Week 10CNN ์ฌํ์ ์ ์ดํ์ต
AlexNet โ VGG โ ResNet์ผ๋ก ์ด์ด์ง๋ ๊ฑฐ๋ ๋คํธ์ํฌ๋ค๊ณผ, ๋จ์ด ํ์ต์์ผ๋์ ๋ชจ๋ธ์ ๊ฐ์ ธ์ ๋ด ๋ฌธ์ ์ ๋ง๊ฒ ๋ฏธ์ธ์กฐ์ ํ๋ ์ ์ดํ์ต ์ค์ .
Week 11RNN๊ณผ LSTM
์๊ฐ์ด ์๋ ๋ฐ์ดํฐ(๋ง, ์์ , ์ฃผ๊ฐ)๋ฅผ ๋ค๋ฃจ๋ ์ ๊ฒฝ๋ง. ๋จ์ RNN์ ํ๊ณ์ ๊ทธ๊ฒ์ ํผ LSTM์ ๊ฒ์ดํธ ๊ตฌ์กฐ๋ฅผ ๊ทธ๋ฆผ์ผ๋ก ์ดํดํฉ๋๋ค.
Week 12Seq2Seq์ Attention
๋ฒ์ญ๊ธฐ์ฒ๋ผ ์ ๋ ฅ ์ํ์ค๋ฅผ ๋ฐ์ ์ถ๋ ฅ ์ํ์ค๋ฅผ ๋ง๋๋ ์ธ์ฝ๋-๋์ฝ๋ ๊ตฌ์กฐ, ๊ทธ๋ฆฌ๊ณ ๋ชจ๋ LLM์ ์ด๋จธ๋์ธ ์ดํ ์ ๋ฉ์ปค๋์ฆ.
Week 13Transformer์ LLM
RNN์ ์์ ํ ๋ฒ๋ฆฌ๊ณ ์ดํ ์ ๋ง์ผ๋ก ๋ง๋ ํธ๋์คํฌ๋จธ. ๊ทธ ์์์ GPTยทBERTยทChatGPT๊ฐ ์ด๋ป๊ฒ ์๋ผ๋ฌ๋์ง, ๊ทธ๋ฆฌ๊ณ ์ฐ๋ฆฌ ๋ฏธ๋๋ ์ด๋๋ก ๊ฐ๋์ง.
6.5 ์ญ์ฌ์ ํ๋ฆ โ ๋ค์ฏ ๋ฒ์ ํ๋
ํ ํ๊ธฐ์ ๋ฐฐ์ธ ์ฃผ์ ๋ค์ ์๊ฐ ์์๋ก ํ ๋ฒ ํ์ผ๋ฉด ํฐ ๊ทธ๋ฆผ์ด ์กํ๋๋ค. ์ด ๋ถ์ผ๋ ํฌ๊ฒ ๋ค์ฏ ๋ฒ์ ํ๋๋ฅผ ํ๊ณ ์ฌ๊ธฐ๊น์ง ์์ต๋๋ค.
- 1950โ1960๋ ๋ โ ์์ง์ฃผ์์ ํผ์ ํธ๋ก . ๋ก์ ๋ธ๋ซ์ ํผ์ ํธ๋ก (1958)์ ๋จ์ผ ๋ด๋ฐ ๋ชจ๋ธ๋ก, ๊ฐ๋จํ ํจํด์ ํ์ตํ ์ ์์์ ๋ณด์ฌ ํฐ ์ฃผ๋ชฉ์ ๋ฐ์์ต๋๋ค. ๊ทธ๋ฌ๋ XOR์ ํ ์ ์๋ค๋ ํ๊ณ๊ฐ ๋๋ฌ๋๋ฉฐ(๋ฏผ์คํค-ํํผํธ 1969) ์ฒซ ๊ฒจ์ธ์ด ์ต๋๋ค.
- 1980โ1990๋ ๋ โ ์ญ์ ํ์ ํต๊ณ์ ํ์ต์ ๋ถ์. 1986๋ ๋ฃจ๋ฉํํธยทํํผยท์๋ฆฌ์์ค๊ฐ ์ญ์ ํ๋ฅผ ๋์คํํ๋ฉฐ ๋ค์ธต ์ ๊ฒฝ๋ง์ด ๋ถํํ์ง๋ง, ๋์์ Vapnik์ SVM๊ณผ Breiman์ ๋๋คํฌ๋ ์คํธ ๊ฐ์ ํต๊ณ์ ๋ฐฉ๋ฒ๋ค์ด ๋ ๊น๋ํ ์ํ๊ณผ ์ด๋ก ์ ๋ณด์ฅ์ ๋ด์ธ์ฐ๋ฉฐ ์ฃผ๋ฅ๊ฐ ๋ฉ๋๋ค. ์ ๊ฒฝ๋ง์ ๋ ํ ๋ฒ ๋ณ๋ฐฉ์ผ๋ก ๋ฐ๋ ค๋ฉ๋๋ค.
- 2006โ2011๋ โ ์ฌ์ ํ์ต์ ์คํ. ํํผ ๊ทธ๋ฃน์ด RBM(Restricted Boltzmann Machine)๊ณผ deep belief network๋ก "๊น์ ๋ง๋ ์ธต๋ณ ์ฌ์ ํ์ตํ๋ฉด ํ์ต ๊ฐ๋ฅํ๋ค"๋ ํํธ๋ฅผ ๋ด๋์ต๋๋ค. ์ด ์๊ธฐ๋ถํฐ "Deep Learning"์ด๋ผ๋ ๋ธ๋๋๊ฐ ์กฐ๊ธ์ฉ ์ฐ์ด๊ธฐ ์์ํฉ๋๋ค.
- 2012โ2017๋ โ ์ปจ๋ณผ๋ฃจ์ ์ ํฉ๊ธ๊ธฐ. AlexNet(2012), VGG(2014), GoogLeNet(2014), ResNet(2015), DenseNet(2017)๋ก ์ด์ด์ง๋ CNN ํญ์ฃผ ์๊ธฐ. ์ด๋ฏธ์ง๋ท ์๋ฌ์จ์ 26%์์ 3% ์ดํ๋ก ๋จ์ด์ง๋ฉฐ ์ฌ๋๋ณด๋ค ์ ๋ถ๋ฅํ๊ฒ ๋ฉ๋๋ค. ์ด ํ๋ฆ์ W9ยทW10์์ ์์ธํ ๋ค๋ฃน๋๋ค.
- 2017โํ์ฌ โ ํธ๋์คํฌ๋จธ์ LLM. 2017๋ "Attention Is All You Need" ๋ ผ๋ฌธ์ด RNN ์์ด ์ดํ ์ ๋ง์ผ๋ก ๋ฒ์ญ ์ต๊ณ ์ฑ๋ฅ์ ๋ ๋๋ค. 2018๋ BERT, ๊ฐ์ ํด GPT-1, 2020๋ GPT-3, 2022๋ ChatGPT๋ก ์ด์ด์ง๋ฉฐ ์ธ์ดยท๋น์ ยท๋ฉํฐ๋ชจ๋ฌ์ด ํตํฉ๋ฉ๋๋ค. ์ฐ๋ฆฌ๋ W13์์ ๊ทธ ๋ด๋ถ๋ฅผ ๋ฏ์ด๋ณผ ๊ฒ๋๋ค.
์ด ๋ค์ฏ ํ๋๋ ์๋ก ๋จ์ ๋ ๊ฒ์ด ์๋๋ผ, ์ด์ ์์ด๋์ด๊ฐ ์ด์๋จ์ ๋ค์ ํ๋์ ๋ถํ์ด ๋๋ ํํ๋ก ์ด์ด์ง๋๋ค. ๋ก์ ๋ธ๋ซ์ ๋จ์ผ ๋ด๋ฐ์ ์ง๊ธ๋ ์์ ์ฐ๊ฒฐ์ธต์ ๊ธฐ๋ณธ ๋จ์์ด๊ณ , 1986๋
์ ์ญ์ ํ๋ ์ค๋๋ PyTorch์ .backward() ํ ์ค๋ก ์จ์ด ์์ผ๋ฉฐ, SVM์ ์ปค๋ ํธ๋ฆญ์ ํ๋ ํธ๋์คํฌ๋จธ์ ์ดํ
์
์ ์์ ์ํ์ ์ผ๋ก ๋ฎ์ ์์ต๋๋ค. ์๋ ์์ด๋์ด๋ฅผ ์๋ค๋ ๊ฒ์ ์ ๋ฌผ ์์ง์ด ์๋๋ผ ํ๋ ๊ธฐ๋ฒ์ DNA๋ฅผ ์ดํดํ๋ ์ผ์
๋๋ค.
7. ํ ํ๊ธฐ ๊ณต๋ถ๋ฒ โ ์์ด ๋จผ์ ์ฌ์ผ ํ๋ค
๋จธ์ ๋ฌ๋์ ์ํยทํ๋ก๊ทธ๋๋ฐยท๋ฐ์ดํฐ ๊ฐ๊ฐ์ด ์ธ ๋ค๋ฆฌ๋ก ๋ฐ์น๋ ๋ถ์ผ์ ๋๋ค. ํ ๋ค๋ฆฌ๋ผ๋ ์งง์ผ๋ฉด ์์๊ฐ ๊ธฐ์ฐ๋ฑํฉ๋๋ค. ๊ฐ์๋ฅผ ๋ค์ ๋๋ง๋ค ๋ฐ๋์ ์์ผ๋ก ์ฝ๋๋ฅผ ๋๋ ค๋ณด๊ธธ ๊ถํฉ๋๋ค. ๊ฐ๋ ์ ์ฝ์ผ๋ฉด "์ ๊ฒ ๊ฐ๋ค"๋ ์ฐฉ๊ฐ์ด ์ฝ๊ฒ ์ค๋๋ฐ, ์ค์ ๋ก numpy ๋ฐฐ์ด ํฌ๊ธฐ๋ฅผ ๋ง์ถ๊ณ NaN์ ๋๋ฒ๊น ํ๊ณ loss๊ฐ ๋ฐ์ฐํ๋ ์ฅ๋ฉด์ ๋ณด๊ณ ๋์์ผ "์ง์ง ์"์ด ์๋ฆฌ์ก์ต๋๋ค. ์ด ์์ ์ ๋ชจ๋ ํ์ด์ง์ ์ธํฐ๋ํฐ๋ธ ๋ฐ๋ชจ๊ฐ ์๋ ์ด์ ๋ "๋์ผ๋ก ๋ง์ ธ๋ณด๊ธฐ" ์ํจ์ ๋๋ค.
์ํ์ ๊ฒ๋จน์ง ๋ง๋ ํผํ์ง๋ ๋ง์ญ์์ค. ์ฐ๋ฆฌ๋ ์ ํ๋์(ํ๋ ฌ๊ณฑยท๊ณ ์ณ๊ฐ), ๋ฏธ์ ๋ถ(ํธ๋ฏธ๋ถยท์ฐ์๋ฒ์น), ํ๋ฅ (๊ธฐ๋๊ฐยท๋ฒ ์ด์ฆ ๊ท์น) ์ธ ์์ญ์ ์๊ฒ ๋๋ ๊น๊ฒ ๊ณ์ ์ธ ๊ฒ์ ๋๋ค. ๋ชจ๋ฅด๋ ๊ธฐํธ๊ฐ ๋์๋ ๋นํฉํ์ง ๋ง๊ณ , ๊ทธ ์๋ฆฌ์์ ์์ ์์ ๋ก ์ซ์๋ฅผ ๋์ ํด ๋ณด๋ฉด ๊ฑฐ์ ํญ์ ์ค์ฒด๊ฐ ๋ณด์ ๋๋ค. ์์ปจ๋ $\mathbf{w}^\top \mathbf{x}$๊ฐ ๋ฏ์ค๋ฉด $\mathbf{w}=[2,3]$, $\mathbf{x}=[1,4]$๋ก ๊ณ์ฐํด ๋ณด์ธ์ โ $2\cdot 1 + 3\cdot 4 = 14$, ๊ทธ๋ฟ์ ๋๋ค.
๋ง์ง๋ง์ผ๋ก, ๋จธ์ ๋ฌ๋์ ๋ณธ์ง์ ์ผ๋ก ์ผ๋ฐํ์ ํ๋ฌธ์ ๋๋ค. "ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ์ ๋ง์ถ๋ ๊ฒ"๊ณผ "๋ณธ ์ ์๋ ๋ฐ์ดํฐ์๋ ์ ์๋ํ๋ ๊ฒ"์ ์ ํ ๋ค๋ฅธ ๋ฌธ์ ์ด๊ณ , ํ๊ธฐ ๋ด๋ด ์ฐ๋ฆฌ๊ฐ ์ธ์ฐ๊ฒ ๋ ๊ฐ์ฅ ํฐ ์ ์ ๊ณผ์ ํฉ(overfitting)์ ๋๋ค. ์ด ๋จ์ด๋ ๋งค์ฃผ ๋์์ฌ ๊ฒ์ด๋ ๋ฏธ๋ฆฌ ์นํด์ ธ ๋์ธ์.
๐ ๋ ๊น์ด ๊ณต๋ถํ๊ธฐ
- ํผ์ ๊ณต๋ถํ๋ ๋จธ์ ๋ฌ๋+๋ฅ๋ฌ๋ โ ๋ฐํด์ ์ . ๋๋ฏธ/๋น์ด ์์ ๋ก ๋ถ๋๋ฝ๊ฒ ๋ค์ด๊ฐ๋ ํ๊ตญ์ด ์ ๋ฌธ์.
- Sung Kim์ ๋ชจ๋๋ฅผ ์ํ ๋จธ์ ๋ฌ๋/๋ฅ๋ฌ๋ โ hunkim.github.io/ml. ํ๊ตญ์ด ๊ฐ์์ ๊ณ ์ .
- scikit-learn ๊ณต์ ํํ ๋ฆฌ์ผ โ scikit-learn.org. KNN์ ๋น๋กฏํ ๋ชจ๋ ๊ณ ์ ML์ด ํ์๋ฆฌ์.
- Pattern Recognition and Machine Learning โ Bishop. ๊น์ด ์๊ฒ ๊ฐ๊ณ ์ถ์ ๋์ ํ์ค ๊ต๊ณผ์.