โ† ์ฃผ์ฐจ ๋ชฉ๋ก

Week 1. AI์˜ ์„ธ๊ณ„

์ธ๊ณต์ง€๋Šฅ์ด๋ผ๋Š” ํฐ ์ˆฒ์„ ํ•œ ๋ฐ”ํ€ด ๋‘˜๋Ÿฌ๋ณด๊ณ , ๊ฐ€์žฅ ๋‹จ์ˆœํ•˜์ง€๋งŒ ๊ฐ•๋ ฅํ•œ ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ์ง์ ‘ ์†์œผ๋กœ ๊ตด๋ ค๋ด…๋‹ˆ๋‹ค.

์ด๋ฒˆ ์ฃผ์— ๋ฐฐ์šฐ๋Š” ๊ฒƒ

  1. AI ยท ML ยท DL์˜ ํฌํ•จ ๊ด€๊ณ„
  2. ์ง€๋„ํ•™์Šต๊ณผ ๋น„์ง€๋„ํ•™์Šต, ๋ถ„๋ฅ˜์™€ ํšŒ๊ท€
  3. ๊ฐ€์žฅ ๋‹จ์ˆœํ•œ ๋ถ„๋ฅ˜๊ธฐ: K-์ตœ๊ทผ์ ‘ ์ด์›ƒ (KNN)
  4. ๊ฑฐ๋ฆฌ ์ฒ™๋„: ์œ ํด๋ฆฌ๋“œ vs ๋งจํ•ดํŠผ
  5. scikit-learn ์ฝ”๋“œ ํ•œ ์ค„ ์ฒดํ—˜
  6. 13์ฃผ์ฐจ ์ „์ฒด ๋กœ๋“œ๋งต

0. ๋“ค์–ด๊ฐ€๋ฉฐ โ€” ์™œ ํ•˜ํ•„ ์ง€๊ธˆ AI์ธ๊ฐ€

์ธ๊ณต์ง€๋Šฅ์ด๋ผ๋Š” ๋ง์€ 1956๋…„ ๋‹คํŠธ๋จธ์Šค ํšŒ์˜์—์„œ ์ฒ˜์Œ ๊ณต์‹ํ™”๋์Šต๋‹ˆ๋‹ค. ์กด ๋งค์นด์‹œ, ๋งˆ๋นˆ ๋ฏผ์Šคํ‚ค, ํด๋กœ๋“œ ์„€๋„Œ ๊ฐ™์€ ์ „์„ค์  ์ธ๋ฌผ๋“ค์ด "์ƒ๊ฐํ•˜๋Š” ๊ธฐ๊ณ„๋ฅผ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋‹ค"๊ณ  ์„ ์–ธํ•œ ๊ทธ ์—ฌ๋ฆ„์˜ ๋‚™๊ด€๋ก ์€, ์ดํ›„ 70๋…„๊ฐ„ ๋‘ ๋ฒˆ์˜ "AI ๊ฒจ์šธ"์„ ๊ฒช์Šต๋‹ˆ๋‹ค. 1970๋…„๋Œ€์—๋Š” ๊ธฐํ˜ธ์ฃผ์˜(symbolic AI)๊ฐ€ ํ˜„์‹ค ์„ธ๊ณ„์˜ ๋ชจํ˜ธํ•จ์„ ๊ฐ๋‹นํ•˜์ง€ ๋ชปํ•ด ๋ฌด๋„ˆ์กŒ๊ณ , 1980๋…„๋Œ€ ๋ง ์ „๋ฌธ๊ฐ€ ์‹œ์Šคํ…œ์˜ ์œ ์ง€๋น„์šฉ์ด ํญ๋ฐœํ•˜๋ฉด์„œ ๋‘ ๋ฒˆ์งธ ๊ฒจ์šธ์ด ์™”์Šต๋‹ˆ๋‹ค. ์‹ ๊ฒฝ๋ง๋„ ์˜ˆ์™ธ๊ฐ€ ์•„๋‹ˆ์–ด์„œ, 1969๋…„ ๋ฏผ์Šคํ‚ค-ํŒŒํผํŠธ์˜ Perceptrons ์ฑ…์ด ๋‹จ์ธต ํผ์…‰ํŠธ๋ก ์˜ XOR ํ•œ๊ณ„๋ฅผ ์ง€์ ํ•˜์ž ์—ฐ๊ตฌ๋น„๊ฐ€ ๋Š๊ฒผ๊ณ , 1990๋…„๋Œ€์—๋Š” SVM๊ณผ ๊ฐ™์€ ๋” ์ˆ˜ํ•™์ ์œผ๋กœ ๊น”๋”ํ•œ ๋ฐฉ๋ฒ•์ด ์ฃผ๋ฅ˜๋ฅผ ์ฐจ์ง€ํ•˜๋ฉฐ ์‹ ๊ฒฝ๋ง์€ ์‚ฌ์‹ค์ƒ ๋ณ€๋ฐฉ์œผ๋กœ ๋ฐ€๋ ค๋‚ฌ์Šต๋‹ˆ๋‹ค.

๋ฐ˜์ „์€ 2012๋…„ ImageNet ๋Œ€ํšŒ์—์„œ ์ผ์–ด๋‚ฌ์Šต๋‹ˆ๋‹ค. ํ† ๋ก ํ†  ๋Œ€ํ•™ ์ œํ”„๋ฆฌ ํžŒํŠผ์˜ ์ œ์ž ์•Œ๋ ‰์Šค ํฌ๋ฆฌ์ œ๋ธŒ์Šคํ‚ค๊ฐ€ ๋งŒ๋“  AlexNet์€ ๊ธฐ์กด ์ตœ๊ณ  ์„ฑ๋Šฅ๋ณด๋‹ค ์˜ค๋ฅ˜์œจ์„ 10%p ๋„˜๊ฒŒ ๋–จ์–ด๋œจ๋ฆฌ๋ฉฐ ์šฐ์Šนํ–ˆ์Šต๋‹ˆ๋‹ค. 5๊ฐœ์˜ ์ปจ๋ณผ๋ฃจ์…˜ ์ธต๊ณผ 3๊ฐœ์˜ ์™„์ „์—ฐ๊ฒฐ ์ธต, ์ด 6000๋งŒ ๊ฐœ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๋‘ ๊ฐœ์˜ GTX 580 GPU๋กœ ์ผ์ฃผ์ผ ๊ฐ€๊นŒ์ด ํ•™์Šต์‹œํ‚จ ์ด ๋ชจ๋ธ์€ ReLU, ๋“œ๋กญ์•„์›ƒ, ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• ๊ฐ™์€ ์ง€๊ธˆ๋„ ์šฐ๋ฆฌ๊ฐ€ ์“ฐ๋Š” ๊ธฐ๋ณธ ๋„๊ตฌ๋“ค์„ ํ•œ๊บผ๋ฒˆ์— ๋ณด์—ฌ์คฌ์Šต๋‹ˆ๋‹ค. ์ด ์‚ฌ๊ฑด์€ ๋‹จ์ˆœํžˆ ํ•œ ๋Œ€ํšŒ์˜ ์šฐ์Šน์„ ๋„˜์–ด, "๊นŠ์€ ์‹ ๊ฒฝ๋ง์ด ์ง„์งœ๋กœ ์ž‘๋™ํ•œ๋‹ค"๋Š” ์ฆ๊ฑฐ๋ฅผ ์—…๊ณ„์— ๋˜์กŒ๊ณ  ์ง€๊ธˆ์˜ ๋”ฅ๋Ÿฌ๋‹ ๋ฅด๋„ค์ƒ์Šค๊ฐ€ ์‹œ์ž‘๋์Šต๋‹ˆ๋‹ค.

์šฐ๋ฆฌ๊ฐ€ ์„ธ ๋ฒˆ์งธ AI ๊ฒจ์šธ์„ ํ”ผํ•œ ์ด์œ ๋Š” ์„ธ ๊ฐ€์ง€๊ฐ€ ํ•œ๊บผ๋ฒˆ์— ์„ฑ์ˆ™ํ–ˆ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค โ€” ์ธํ„ฐ๋„ท๊ณผ ์Šค๋งˆํŠธํฐ์ด ์Ÿ์•„๋‚ธ ๋ฐ์ดํ„ฐ, GPU์™€ TPU๊ฐ€ ๋งŒ๋“ค์–ด๋‚ธ ๊ณ„์‚ฐ๋ ฅ, ๊ทธ๋ฆฌ๊ณ  ReLUยท๋ฐฐ์น˜์ •๊ทœํ™”ยทAdam ๊ฐ™์€ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ํ˜์‹ . ํ•œ ํ•™๊ธฐ ๋™์•ˆ ์šฐ๋ฆฌ๊ฐ€ ๋ฐฐ์šฐ๋Š” ๋ชจ๋“  ์ฃผ์ œ๋Š” ์ด ์„ธ ๊ธฐ๋‘ฅ ์œ„์— ์„œ ์žˆ๋‹ค๊ณ  ๋ณด๋ฉด ๋ฉ๋‹ˆ๋‹ค.

1. AI ยท ML ยท DL โ€” ํ—ท๊ฐˆ๋ฆฌ๋Š” ์„ธ ๋‹จ์–ด

๋‰ด์Šค์—์„œ ๋งค์ผ ๋“ฃ์ง€๋งŒ ๋ง‰์ƒ ์ฐจ์ด๋ฅผ ์„ค๋ช…ํ•˜๋ผ๊ณ  ํ•˜๋ฉด ๋ง‰๋ง‰ํ•ฉ๋‹ˆ๋‹ค. ์‚ฌ์‹ค์€ ํฌํ•จ ๊ด€๊ณ„์ž…๋‹ˆ๋‹ค.

์ฆ‰ AI โŠƒ ML โŠƒ DL. ์ด๋ฒˆ ํ•™๊ธฐ์—๋Š” ๊ฐ€์šด๋ฐ์™€ ๊ฐ€์žฅ ์•ˆ์ชฝ ๋™๊ทธ๋ผ๋ฏธ๋ฅผ ๋ณธ๊ฒฉ์ ์œผ๋กœ ๋‹ค๋ฃน๋‹ˆ๋‹ค.

๊ตฌ์ฒด์ ์ธ ์˜ˆ๋กœ ์ดํ•ดํ•˜๋ฉด ๋” ์„ ๋ช…ํ•ฉ๋‹ˆ๋‹ค. "์ฒด์Šค ํ”„๋กœ๊ทธ๋žจ"์„ ๋งŒ๋“ ๋‹ค๊ณ  ํ•ฉ์‹œ๋‹ค. 1990๋…„๋Œ€์˜ ๋”ฅ๋ธ”๋ฃจ๋Š” ์‚ฌ๋žŒ์ด ์†์œผ๋กœ ํ‰๊ฐ€ ํ•จ์ˆ˜๋ฅผ ์งœ๊ณ  ์•ŒํŒŒ-๋ฒ ํƒ€ ํƒ์ƒ‰์œผ๋กœ ์ˆ˜๋ฅผ ์ฝ๋Š” ๊ทœ์น™ ๊ธฐ๋ฐ˜ AI์˜€์Šต๋‹ˆ๋‹ค โ€” ML์ด ์•„๋‹™๋‹ˆ๋‹ค. 2000๋…„๋Œ€์˜ ์ŠคํŒธ ํ•„ํ„ฐ๋Š” "๋‹จ์–ด์˜ ๋นˆ๋„๋ฅผ ํ”ผ์ฒ˜๋กœ ์“ฐ๊ณ  ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋กœ ๋ถ„๋ฅ˜"ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ, ์‚ฌ๋žŒ์ด ํ”ผ์ฒ˜๋Š” ์„ค๊ณ„ํ•˜์ง€๋งŒ ๊ฐ€์ค‘์น˜๋Š” ๋ฐ์ดํ„ฐ๊ฐ€ ๊ฒฐ์ •ํ•˜๋Š” ML์ž…๋‹ˆ๋‹ค. 2016๋…„์˜ ์•ŒํŒŒ๊ณ ๋Š” ์‚ฌ๋žŒ์ด ํ”ผ์ฒ˜์กฐ์ฐจ ์„ค๊ณ„ํ•˜์ง€ ์•Š๊ณ , ๋ฐ”๋‘‘ํŒ ์ด๋ฏธ์ง€๋ฅผ ํ†ต์งธ๋กœ ๋„ฃ์–ด ์ปจ๋ณผ๋ฃจ์…˜ ์‹ ๊ฒฝ๋ง์ด ์Šค์Šค๋กœ "์ข‹์€ ์ˆ˜"์˜ ํŒจํ„ด์„ ์ฐพ๊ฒŒ ํ•˜๋Š” DL์ž…๋‹ˆ๋‹ค. ๊ฐ™์€ ๋ฌธ์ œ๋„ ์–ด๋А ์ธต์—์„œ ์ ‘๊ทผํ•˜๋А๋ƒ์— ๋”ฐ๋ผ ๋‹ค๋ฅธ ๊ธฐ์ˆ ์ด ๋ฉ๋‹ˆ๋‹ค.

์ดˆ๋ณด์ž๊ฐ€ ์ž์ฃผ ์˜คํ•ดํ•˜๋Š” ๊ฒƒ์€ "๋”ฅ๋Ÿฌ๋‹์€ ํ•ญ์ƒ ๋จธ์‹ ๋Ÿฌ๋‹๋ณด๋‹ค ๋‚ซ๋‹ค"์ž…๋‹ˆ๋‹ค. ์‚ฌ์‹ค์€ ๋ฐ˜๋Œ€์— ๊ฐ€๊น์Šต๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ๊ฐ€ ์ˆ˜๋ฐฑยท์ˆ˜์ฒœ ๊ฑด์— ๋ถˆ๊ณผํ•˜๊ฑฐ๋‚˜, ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ์ด ์ค‘์š”ํ•˜๊ฑฐ๋‚˜(์˜๋ฃŒ ์ง„๋‹จ ๊ทผ๊ฑฐ ์ œ์‹œ), ์—ฃ์ง€ ๋””๋ฐ”์ด์Šค์—์„œ ๋Œ๋ ค์•ผ ํ•œ๋‹ค๋ฉด ๋žœ๋คํฌ๋ ˆ์ŠคํŠธ๋‚˜ ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๊ฐ€ ๋” ๋‚˜์€ ์„ ํƒ์ผ ๋•Œ๊ฐ€ ์•„์ฃผ ๋งŽ์Šต๋‹ˆ๋‹ค. ๋”ฅ๋Ÿฌ๋‹์˜ ์ง„์งœ ๊ฐ•์ ์€ ๋ฐ์ดํ„ฐ๊ฐ€ ์ˆ˜์‹ญ๋งŒ ๊ฑด ์ด์ƒ์ด๊ณ  ํ”ผ์ฒ˜ ์—”์ง€๋‹ˆ์–ด๋ง์ด ์–ด๋ ค์šด ์˜์—ญ(์ด๋ฏธ์ง€, ์Œ์„ฑ, ์ž์—ฐ์–ด)์—์„œ ๋“œ๋Ÿฌ๋‚ฉ๋‹ˆ๋‹ค.

์™œ ๊ฐ‘์ž๊ธฐ ๋”ฅ๋Ÿฌ๋‹์ด ๋–ด์„๊นŒ? ์„ธ ๊ฐ€์ง€๊ฐ€ ๋™์‹œ์— ๊ฐ–์ถฐ์กŒ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. โ‘  ๋ฐ์ดํ„ฐ(์ธํ„ฐ๋„ทยท์Šค๋งˆํŠธํฐ), โ‘ก ๊ณ„์‚ฐ๋ ฅ(GPU), โ‘ข ์•Œ๊ณ ๋ฆฌ์ฆ˜(ReLUยท๋“œ๋กญ์•„์›ƒยท๋ฐฐ์น˜์ •๊ทœํ™”). ์ด ์…‹ ์ค‘ ํ•˜๋‚˜๋ผ๋„ ๋น ์กŒ์œผ๋ฉด ์ง€๊ธˆ์˜ AI ์—ดํ’์€ ์—†์—ˆ์Šต๋‹ˆ๋‹ค.

2. ์ง€๋„ํ•™์Šต vs ๋น„์ง€๋„ํ•™์Šต

๋จธ์‹ ๋Ÿฌ๋‹์„ ๋ถ„๋ฅ˜ํ•˜๋Š” ๊ฐ€์žฅ ํ”ํ•œ ์ถ•์€ "์ •๋‹ต์ด ์žˆ๋А๋ƒ"์ž…๋‹ˆ๋‹ค. ์ •๋‹ต์ด ์žˆ์œผ๋ฉด ์ง€๋„ํ•™์Šต, ์—†์œผ๋ฉด ๋น„์ง€๋„ํ•™์Šต์ž…๋‹ˆ๋‹ค. ์ด ๊ตฌ๋ถ„์€ ๋‹จ์ˆœํ•ด ๋ณด์ด์ง€๋งŒ ์‹ค์ „์—์„œ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ์œผ๋Š” ๋น„์šฉ์˜ ๊ตฌ๋ถ„์ด๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค. ๋ผ๋ฒจ๋ง์€ ๋Œ€๊ฐœ ์‚ฌ๋žŒ์˜ ์†์ด ํ•„์š”ํ•˜๊ณ , ์˜๋ฃŒ์˜์ƒ์ฒ˜๋Ÿผ ์ „๋ฌธ๊ฐ€๊ฐ€ ํ•„์š”ํ•œ ๊ฒฝ์šฐ ์ด๋ฏธ์ง€ ํ•œ ์žฅ๋‹น ์ˆ˜๋งŒ ์›์ด ๋“ค๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด ๋ผ๋ฒจ์ด ์—†๋Š” ๋ฐ์ดํ„ฐ๋Š” ์ธํ„ฐ๋„ท์— ๋ฌดํ•œํžˆ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ž˜์„œ ์š”์ฆ˜ LLM๋“ค์ด ์‚ฌ์šฉํ•˜๋Š” ์ž๊ธฐ์ง€๋„ํ•™์Šต(self-supervised)์€ "๋ผ๋ฒจ ์—†๋Š” ๋ฐ์ดํ„ฐ์—์„œ ์ธ์œ„์ ์ธ ์ •๋‹ต์„ ๋งŒ๋“ค์–ด๋‚ด" ์ง€๋„ํ•™์Šต์ฒ˜๋Ÿผ ํ›ˆ๋ จํ•˜๋Š” ์ ‘๊ทผ์ธ๋ฐ, ์ด ์ด์•ผ๊ธฐ๋Š” W13 ํŠธ๋žœ์Šคํฌ๋จธ์™€ LLM์—์„œ ๋‹ค์‹œ ๋งŒ๋‚ฉ๋‹ˆ๋‹ค.

๋ถ„๋ฅ˜์ž…๋ ฅ์˜ˆ์‹œ
์ง€๋„ํ•™์Šต (Supervised)์ž…๋ ฅ + ์ •๋‹ต ๋ผ๋ฒจ๋„๋ฏธ/๋น™์–ด ๋ถ„๋ฅ˜, ์ง‘๊ฐ’ ์˜ˆ์ธก, ๋ฉ”์ผ ์ŠคํŒธ ํŒ์ •
๋น„์ง€๋„ํ•™์Šต (Unsupervised)์ž…๋ ฅ๋งŒ๊ณ ๊ฐ ๊ตฐ์ง‘ํ™”, ์ฐจ์› ์ถ•์†Œ, ์ด์ƒ์น˜ ํƒ์ง€
๊ฐ•ํ™”ํ•™์Šต (Reinforcement)์ƒํƒœ + ๋ณด์ƒ์•ŒํŒŒ๊ณ , ๋กœ๋ด‡ ๋ณดํ–‰, ๊ฒŒ์ž„ AI

์ง€๋„ํ•™์Šต์€ ๋‹ค์‹œ ๋‘ ์ข…๋ฅ˜๋กœ ๋‚˜๋‰ฉ๋‹ˆ๋‹ค.

๐ŸŽฎ ์ธํ„ฐ๋ž™ํ‹ฐ๋ธŒ: ์ง€๋„/๋น„์ง€๋„ ๋ฐ์ดํ„ฐ ์ƒ์„ฑ๊ธฐ

ํด๋Ÿฌ์Šคํ„ฐ ์ˆ˜์™€ ๋ถ„์‚ฐ์„ ์กฐ์ ˆํ•ด ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. "๋ผ๋ฒจ ๋ณด์ด๊ธฐ"๋ฅผ ๋„๋ฉด ๋น„์ง€๋„ํ•™์Šต ์ž…์žฅ์—์„œ ๋ณธ ๋ฐ์ดํ„ฐ์ž…๋‹ˆ๋‹ค โ€” ์ƒ‰์ด ์—†์œผ๋‹ˆ ๊ทธ์ € ์  ๋ฌด๋”๊ธฐ์ฃ .

3. K-Nearest Neighbors (KNN)

KNN์€ 1951๋…„ Fix์™€ Hodges๊ฐ€ ๋ฐœํ‘œํ•œ, ๋จธ์‹ ๋Ÿฌ๋‹์˜ ๊ฐ€์žฅ ์›๋กœ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค. "๋น„์Šทํ•œ ๊ฒƒ์€ ๋น„์Šทํ•œ ๋‹ต์„ ๊ฐ€์งˆ ๊ฒƒ์ด๋‹ค"๋ผ๋Š” ๋„ˆ๋ฌด๋‚˜ ๋‹น์—ฐํ•œ ๊ฐ€์ •์—์„œ ์ถœ๋ฐœํ•ฉ๋‹ˆ๋‹ค. ์žฌ๋ฏธ์žˆ๋Š” ์ ์€ KNN์—๋Š” ์‚ฌ์‹ค ํ•™์Šต ๋‹จ๊ณ„๊ฐ€ ์—†๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋ฅผ ๊ทธ๋Œ€๋กœ ์ €์žฅํ•ด๋‘๊ธฐ๋งŒ ํ•  ๋ฟ์ด๊ณ , ๋ชจ๋“  ๊ณ„์‚ฐ์€ ์˜ˆ์ธก ์‹œ์ ์— ์ผ์–ด๋‚ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฐ ๋ฐฉ์‹์„ ๊ฒŒ์œผ๋ฅธ ํ•™์Šต(lazy learning)์ด๋ผ๊ณ  ๋ถ€๋ฆ…๋‹ˆ๋‹ค. ๋Œ€๋น„๋˜๋Š” eager learning(์˜ˆ: ์‹ ๊ฒฝ๋ง)์€ ํ•™์Šต ๋•Œ ๋งŽ์€ ์‹œ๊ฐ„์„ ์“ฐ๊ณ  ์˜ˆ์ธก์€ ๋น ๋ฅธ๋ฐ, KNN์€ ์ •๋ฐ˜๋Œ€๋ผ ์‹ค์‹œ๊ฐ„ ์˜ˆ์ธก์ด ํ•„์š”ํ•œ ์ƒํ™ฉ์—์„œ๋Š” ์˜คํžˆ๋ ค ๋ถˆ๋ฆฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์•„์ฃผ ์ž‘์€ ์˜ˆ๋กœ ๊ฐ์„ ์žก์•„๋ด…์‹œ๋‹ค. ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๊ฐ€ ์„ธ ์ ์ด๋ผ ํ•ฉ์‹œ๋‹ค: A=(1,1, ๋„๋ฏธ), B=(2,2, ๋„๋ฏธ), C=(5,5, ๋น™์–ด). ์ƒˆ ์  X=(3,3)์„ K=1๋กœ ๋ถ„๋ฅ˜ํ•˜๋ฉด, ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด ์ ์€ B(๊ฑฐ๋ฆฌ $\sqrt{2}$)์ด๋ฏ€๋กœ ๋„๋ฏธ๋กœ ๋ถ„๋ฅ˜๋ฉ๋‹ˆ๋‹ค. K=3์ด๋ฉด ์„ธ ์  ๋ชจ๋‘ ๊ณ ๋ คํ•ด ๋‹ค์ˆ˜๊ฒฐ์ธ๋ฐ, ๋„๋ฏธ 2 vs ๋น™์–ด 1์ด๋ผ ์—ฌ์ „ํžˆ ๋„๋ฏธ์ž…๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ์†์œผ๋กœ ๋”ฐ๋ผ๊ฐ€ ๋ณด๋ฉด "ํ•™์Šต์ด ์—†๋‹ค"๋Š” ๋ง์˜ ์˜๋ฏธ๊ฐ€ ๋ถ„๋ช…ํ•ด์ง‘๋‹ˆ๋‹ค โ€” ์šฐ๋ฆฌ๋Š” ์•„๋ฌด ๊ฐ€์ค‘์น˜๋„ ์—…๋ฐ์ดํŠธํ•˜์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค.

๊ฐ€์žฅ ๋‹จ์ˆœํ•˜๊ณ  ์ง๊ด€์ ์ธ ๋ถ„๋ฅ˜๊ธฐ์ž…๋‹ˆ๋‹ค. ํ•™์Šต์ด๋ผ ํ•  ๋งŒํ•œ ๊ฒŒ ์—†์Šต๋‹ˆ๋‹ค โ€” ๊ทธ๋ƒฅ ๋ฐ์ดํ„ฐ๋ฅผ ํ†ต์งธ๋กœ ์™ธ์›Œ๋‘˜ ๋ฟ. ์ƒˆ ๋ฐ์ดํ„ฐ๊ฐ€ ๋“ค์–ด์˜ค๋ฉด:

  1. ํ•™์Šต ๋ฐ์ดํ„ฐ ์ค‘ ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด K๊ฐœ์˜ ์ด์›ƒ์„ ์ฐพ์Šต๋‹ˆ๋‹ค.
  2. ๊ทธ K๊ฐœ์˜ ํด๋ž˜์Šค๋ฅผ ๋ณด๊ณ  ๋‹ค์ˆ˜๊ฒฐ๋กœ ๊ฒฐ์ •ํ•ฉ๋‹ˆ๋‹ค.
$$ \text{class}(\mathbf{x}) = \arg\max_{c} \sum_{i \in N_K(\mathbf{x})} \mathbb{1}(y_i = c) $$

$N_K(\mathbf{x})$๋Š” $\mathbf{x}$์˜ K๊ฐœ ์ตœ๊ทผ์ ‘ ์ด์›ƒ, $\mathbb{1}$์€ ์กฐ๊ฑด์ด ์ฐธ์ด๋ฉด 1์ž…๋‹ˆ๋‹ค. ๊ฑฐ๋ฆฌ๋Š” ๋ณดํ†ต ์œ ํด๋ฆฌ๋“œ ๊ฑฐ๋ฆฌ๋ฅผ ์”๋‹ˆ๋‹ค.

$$ d_{\text{Euclid}}(\mathbf{x},\mathbf{y}) = \sqrt{\sum_i (x_i - y_i)^2}, \quad d_{\text{Manhattan}}(\mathbf{x},\mathbf{y}) = \sum_i |x_i - y_i| $$
K๊ฐ€ ์ž‘์œผ๋ฉด ๋ชจ๋ธ์ด ๋„ˆ๋ฌด ๋ฏผ๊ฐํ•ด์ ธ ์žก์Œ๊นŒ์ง€ ์™ธ์šฐ๋Š” ๊ณผ์ ํ•ฉ์ด, K๊ฐ€ ํฌ๋ฉด ๋„ˆ๋ฌด ๋‘”ํ•ด์ง€๋Š” ๊ณผ์†Œ์ ํ•ฉ์ด ์ผ์–ด๋‚ฉ๋‹ˆ๋‹ค. ๋ณดํ†ต ํ™€์ˆ˜๋กœ ์žก๊ณ (๋‹ค์ˆ˜๊ฒฐ ๋™์  ๋ฐฉ์ง€) ๊ต์ฐจ๊ฒ€์ฆ์œผ๋กœ ๊ณ ๋ฆ…๋‹ˆ๋‹ค.

๐ŸŽฎ ์ธํ„ฐ๋ž™ํ‹ฐ๋ธŒ: KNN ๊ฒฐ์ • ๊ฒฝ๊ณ„

๋„๋ฏธ(ํŒŒ๋ž‘)์™€ ๋น™์–ด(์ฃผํ™ฉ) ๋ฐ์ดํ„ฐ์ž…๋‹ˆ๋‹ค. K๋ฅผ ์กฐ์ ˆํ•˜๋ฉฐ ๊ฒฐ์ • ๊ฒฝ๊ณ„๊ฐ€ ์–ด๋–ป๊ฒŒ ๋ณ€ํ•˜๋Š”์ง€ ๋ณด์„ธ์š”. ์บ”๋ฒ„์Šค๋ฅผ ํด๋ฆญํ•ด ์ƒˆ ๋ฐ์ดํ„ฐ๋ฅผ ์ถ”๊ฐ€ํ•  ์ˆ˜ ์žˆ๊ณ , ์šฐํด๋ฆญ์€ ๋น™์–ด์ž…๋‹ˆ๋‹ค.

๐Ÿ”ต ๋„๋ฏธ   ๐ŸŸ  ๋น™์–ด   ํด๋ฆญ: ๋„๋ฏธ ์ถ”๊ฐ€, ์šฐํด๋ฆญ: ๋น™์–ด ์ถ”๊ฐ€
KNN์˜ ์ˆจ์€ ํ•จ์ • โ€” ์Šค์ผ€์ผ๊ณผ ์ฐจ์›. ๊ธธ์ด(cm)์™€ ๋ฌด๊ฒŒ(g)๋ฅผ ๊ฐ™์ด ์“ฐ๋ฉด, ์ˆซ์ž๊ฐ€ ํฐ ๋ฌด๊ฒŒ๊ฐ€ ๊ฑฐ๋ฆฌ ๊ณ„์‚ฐ์„ ์ง€๋ฐฐํ•ด ๊ธธ์ด๋Š” ๊ฑฐ์˜ ๋ฌด์‹œ๋ฉ๋‹ˆ๋‹ค. ๋ฐ˜๋“œ์‹œ ํ‘œ์ค€ํ™”ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค(W2์—์„œ ๋‹ค๋ฃน๋‹ˆ๋‹ค). ๋˜ ์ฐจ์›์ด ์ˆ˜์‹ญ ๊ฐœ๋ฅผ ๋„˜์–ด๊ฐ€๋ฉด "๊ฐ€์žฅ ๊ฐ€๊นŒ์šด ์ด์›ƒ"๊ณผ "๊ฐ€์žฅ ๋จผ ์ด์›ƒ"์˜ ๊ฑฐ๋ฆฌ ์ฐจ์ด๊ฐ€ 0์— ์ˆ˜๋ ดํ•˜๋Š” ์ฐจ์›์˜ ์ €์ฃผ๊ฐ€ ์ผ์–ด๋‚˜, KNN์€ ๋ฌด์šฉ์ง€๋ฌผ์ด ๋ฉ๋‹ˆ๋‹ค. ๊ทธ๋ž˜์„œ ๊ณ ์ฐจ์› ๋ฐ์ดํ„ฐ์—๋Š” PCA(W6)๋กœ ์ฐจ์›์„ ๋จผ์ € ์ค„์ด๊ฑฐ๋‚˜ ์•„์˜ˆ ๋‹ค๋ฅธ ๋ชจ๋ธ์„ ์”๋‹ˆ๋‹ค.

4. ๊ฑฐ๋ฆฌ ์ฒ™๋„ ๋น„๊ต

"๊ฐ€๊น๋‹ค"์˜ ์ •์˜๋Š” ํ•œ ๊ฐ€์ง€๊ฐ€ ์•„๋‹™๋‹ˆ๋‹ค. ์œ ํด๋ฆฌ๋“œ๋Š” ์ง์„  ๊ฑฐ๋ฆฌ, ๋งจํ•ดํŠผ์€ ๋„์‹œ ๋ธ”๋ก์„ ๋”ฐ๋ผ๊ฐ€๋Š” ๊ฑฐ๋ฆฌ์ž…๋‹ˆ๋‹ค. ์ฐจ์›์ด ๋†’์•„์งˆ์ˆ˜๋ก ๋‘ ๊ฑฐ๋ฆฌ์˜ ์ฐจ์ด๊ฐ€ ์ปค์ง€๋Š”๋ฐ, ์ด๋ฅผ ์ฐจ์›์˜ ์ €์ฃผ๋ผ๊ณ ๋„ ํ•ฉ๋‹ˆ๋‹ค.

๐ŸŽฎ ์ธํ„ฐ๋ž™ํ‹ฐ๋ธŒ: ์œ ํด๋ฆฌ๋“œ vs ๋งจํ•ดํŠผ

์ค‘์‹ฌ์ ์—์„œ ๊ฐ™์€ ๊ฑฐ๋ฆฌ์— ์žˆ๋Š” ์ ๋“ค์˜ ์ง‘ํ•ฉ(=๋“ฑ๊ฑฐ๋ฆฌ์›)์„ ๊ทธ๋ฆฝ๋‹ˆ๋‹ค. ์œ ํด๋ฆฌ๋“œ๋Š” ๋™๊ทธ๋ž€ ์›์ด์ง€๋งŒ ๋งจํ•ดํŠผ์€ ๋งˆ๋ฆ„๋ชจ(์ •์‚ฌ๊ฐํ˜• ํšŒ์ „)์ž…๋‹ˆ๋‹ค.

๊ธฐํ•˜ํ•™์ ์œผ๋กœ ์ƒ๊ฐํ•˜๋ฉด, ๊ฑฐ๋ฆฌ ์ฒ™๋„๋ฅผ ๋ฐ”๊พผ๋‹ค๋Š” ๊ฒƒ์€ "๊ฐ™์€ ๊ฑฐ๋ฆฌ"์˜ ์˜๋ฏธ๋ฅผ ๋ฐ”๊พธ๋Š” ์ผ์ž…๋‹ˆ๋‹ค. ์œ ํด๋ฆฌ๋“œ์—์„œ๋Š” ๋“ฑ๊ฑฐ๋ฆฌ ์ง‘ํ•ฉ์ด ์›์ด๊ณ , ๋งจํ•ดํŠผ์—์„œ๋Š” 45๋„ ํšŒ์ „ํ•œ ์ •์‚ฌ๊ฐํ˜•(๋งˆ๋ฆ„๋ชจ), ์ฒด๋น„์…ฐํ”„($L_\infty$)์—์„œ๋Š” ์ •์‚ฌ๊ฐํ˜•์ด ๋ฉ๋‹ˆ๋‹ค. ๋” ์ผ๋ฐ˜ํ™”ํ•œ ๋ฏผ์ฝ”ํ”„์Šคํ‚ค ๊ฑฐ๋ฆฌ $d_p(\mathbf x,\mathbf y)=(\sum |x_i-y_i|^p)^{1/p}$๋Š” $p$์— ๋”ฐ๋ผ ๋ชจ์–‘์ด ๋ถ€๋“œ๋Ÿฝ๊ฒŒ ๋ฐ”๋€๋‹ˆ๋‹ค. $p=2$๊ฐ€ ๊ฐ€์žฅ ํ”ํ•œ ์ด์œ ๋Š” ํšŒ์ „์— ๋ถˆ๋ณ€์ด๋ผ์„œ ์ขŒํ‘œ๊ณ„๋ฅผ ๋ฐ”๊ฟ”๋„ ๊ฒฐ๊ณผ๊ฐ€ ๊ฐ™๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.

5. ์ฝ”๋“œ ์˜ˆ์ œ (scikit-learn)

# ๋„๋ฏธ(0) vs ๋น™์–ด(1) ๋ถ„๋ฅ˜
from sklearn.neighbors import KNeighborsClassifier

# ๊ธธ์ด(cm), ๋ฌด๊ฒŒ(g)
fish_data = [[25.4, 242], [26.3, 290], [26.5, 340], [29.0, 363],
             [9.8, 6.7], [10.5, 7.5], [10.6, 7.0], [11.0, 9.7]]
fish_label = [0, 0, 0, 0, 1, 1, 1, 1]

kn = KNeighborsClassifier(n_neighbors=3)
kn.fit(fish_data, fish_label)

print(kn.predict([[30, 600]]))   # โ†’ [0]  (๋„๋ฏธ)
print(kn.score(fish_data, fish_label))   # โ†’ 1.0

scikit-learn์€ 2007๋…„ David Cournapeau๊ฐ€ ์‹œ์ž‘ํ•œ ํŒŒ์ด์ฌ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋กœ, "๋ชจ๋“  ๋ชจ๋ธ์ด fitยทpredictยทscore๋ผ๋Š” ๋™์ผํ•œ ์ธํ„ฐํŽ˜์ด์Šค๋ฅผ ๊ณต์œ ํ•œ๋‹ค"๋Š” ์ฒ ํ•™์ด ํ•ต์‹ฌ์ž…๋‹ˆ๋‹ค. ๋•๋ถ„์— KNN์„ ๋žœ๋คํฌ๋ ˆ์ŠคํŠธ๋กœ ๋ฐ”๊ฟ€ ๋•Œ ํ•œ ์ค„๋งŒ ๊ณ ์น˜๋ฉด ๋ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ํ•™๊ธฐ ๋‚ด๋‚ด ์ด ์ธํ„ฐํŽ˜์ด์Šค๋ฅผ ๊ธฐ์ค€์ ์œผ๋กœ ์‚ผ๊ณ , ๋”ฅ๋Ÿฌ๋‹์œผ๋กœ ๋„˜์–ด๊ฐ€๋ฉด PyTorch์˜ forward/backward ์Šคํƒ€์ผ๋กœ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ์ง„ํ™”ํ•ด ๊ฐˆ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

์‹ค์ „ ํŒ. KNN์—์„œ n_neighbors๋Š” ๋ณดํ†ต 3~15 ์‚ฌ์ด์—์„œ ๊ต์ฐจ๊ฒ€์ฆ์œผ๋กœ ๊ณ ๋ฆ…๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ๊ฐ€ ๋งŽ์œผ๋ฉด(์ˆ˜๋งŒ ๊ฑด ์ด์ƒ) ๊ฑฐ๋ฆฌ ๊ณ„์‚ฐ์ด $O(N)$์ด๋ผ ์˜ˆ์ธก์ด ๋А๋ ค์ง€๋ฏ€๋กœ algorithm='ball_tree'๋‚˜ 'kd_tree'๋กœ ๊ฐ€์†ํ•˜๊ฑฐ๋‚˜, ๊ทผ์‚ฌ ์ตœ๊ทผ์ ‘ ์ด์›ƒ(FAISS, Annoy)์„ ์”๋‹ˆ๋‹ค. ๊ฑฐ๋ฆฌ ๊ธฐ๋ฐ˜ ๊ฐ€์ค‘ ํˆฌํ‘œ(weights='distance')๋Š” ๊ฐ€๊นŒ์šด ์ด์›ƒ์— ๋” ํฐ ํ‘œ๋ฅผ ์ฃผ๋Š”๋ฐ, ๊ฒฝ๊ณ„๊ฐ€ ๋ณต์žกํ•œ ๋ฐ์ดํ„ฐ์—์„œ ํšจ๊ณผ๊ฐ€ ์ข‹์Šต๋‹ˆ๋‹ค.

6. 13์ฃผ ์ „์ฒด ๋กœ๋“œ๋งต

์ด๋ฒˆ ํ•™๊ธฐ ์šฐ๋ฆฌ๋Š” ๋ฐ์ดํ„ฐ ๋‹ค๋ฃจ๊ธฐ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•ด ํšŒ๊ท€ยท๋ถ„๋ฅ˜ยท์‹ ๊ฒฝ๋งยทCNNยทRNN์„ ๊ฑฐ์ณ ํŠธ๋žœ์Šคํฌ๋จธ์™€ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ๊นŒ์ง€ ๊ฐ‘๋‹ˆ๋‹ค. ๊ฐ ์นด๋“œ๋ฅผ ๋ˆŒ๋Ÿฌ ํ•ด๋‹น ์ฃผ์ฐจ๋กœ ๋ฐ”๋กœ ์ด๋™ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Week 2

๋ฐ์ดํ„ฐ ํ•ธ๋“ค๋ง

๋ชจ๋ธ๋ณด๋‹ค ๋ฐ์ดํ„ฐ๊ฐ€ ๋จผ์ €์ž…๋‹ˆ๋‹ค. NumPy ๋ฐฐ์—ด, pandas ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„, ํ‘œ์ค€ํ™”์™€ ์ •๊ทœํ™”, ํ•™์Šต/๊ฒ€์ฆ/ํ…Œ์ŠคํŠธ ๋ถ„ํ• ๊นŒ์ง€ โ€” ๋จธ์‹ ๋Ÿฌ๋‹ ํŒŒ์ดํ”„๋ผ์ธ์˜ ์ ˆ๋ฐ˜์€ ์—ฌ๊ธฐ์„œ ๋๋‚ฉ๋‹ˆ๋‹ค.

Week 3

ํšŒ๊ท€ 1: ์„ ํ˜•ํšŒ๊ท€

๊ฐ€์žฅ ๋‹จ์ˆœํ•œ ๋ชจ๋ธ๋กœ ์ง์„ ์„ ๋ฐ์ดํ„ฐ์— ๋งž์ถฅ๋‹ˆ๋‹ค. ๋น„์šฉํ•จ์ˆ˜(MSE)์™€ ๊ฒฝ์‚ฌํ•˜๊ฐ•๋ฒ•์ด๋ผ๋Š” ๋‘ ๋„๊ตฌ๋กœ "ํ•™์Šต"์ด ๋ฌด์—‡์ธ์ง€ ์ฒ˜์Œ ๋งŒ์ง€๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

Week 4

ํšŒ๊ท€ 2: ๋‹ค์ค‘ํšŒ๊ท€์™€ ๋กœ์ง€์Šคํ‹ฑ

์ž…๋ ฅ์ด ์—ฌ๋Ÿฌ ๊ฐœ์ธ ๋‹ค์ค‘ํšŒ๊ท€, 0/1์„ ์˜ˆ์ธกํ•˜๋Š” ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€, ๊ทธ๋ฆฌ๊ณ  ์—ฌ๋Ÿฌ ํด๋ž˜์Šค๋ฅผ ๋‹ค๋ฃจ๋Š” ์†Œํ”„ํŠธ๋งฅ์Šค. ๋ถ„๋ฅ˜์™€ ํšŒ๊ท€์˜ ๋‹ค๋ฆฌ๋ฅผ ๋†“์Šต๋‹ˆ๋‹ค.

Week 5

๋ถ„๋ฅ˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜

KNN์„ ๋” ๊นŠ์ด ๋ณด๊ณ , ๋งˆ์ง„์„ ์ตœ๋Œ€ํ™”ํ•˜๋Š” SVM, ์งˆ๋ฌธ์„ ๊ฐ€์ง€์น˜๋Š” ๊ฒฐ์ •ํŠธ๋ฆฌ, ๋‚˜๋ฌด ์—ฌ๋Ÿฌ ๊ทธ๋ฃจ๋ฅผ ๋ชจ์€ ๋žœ๋คํฌ๋ ˆ์ŠคํŠธ๊นŒ์ง€. ๊ณ ์ „ ๋จธ์‹ ๋Ÿฌ๋‹์˜ ํ•ต์‹ฌ ๋„๊ตฌ์ƒ์ž์ž…๋‹ˆ๋‹ค.

Week 6

๋น„์ง€๋„ํ•™์Šต

๋ผ๋ฒจ ์—†์ด ๋ฐ์ดํ„ฐ์˜ ๊ตฌ์กฐ๋ฅผ ์ฐพ์Šต๋‹ˆ๋‹ค. K-ํ‰๊ท  ๊ตฐ์ง‘ํ™”, ๋ฐ€๋„ ๊ธฐ๋ฐ˜ DBSCAN, ๊ทธ๋ฆฌ๊ณ  ์ฐจ์›์„ ์ค„์ด๋Š” PCA. "์„ธ์ƒ์„ ๋‹จ์ˆœํ•˜๊ฒŒ ๋ณด๋Š” ๋ฒ•"์„ ๋ฐฐ์›๋‹ˆ๋‹ค.

Week 7

ํผ์…‰ํŠธ๋ก ๊ณผ MLP

์‹ ๊ฒฝ๋ง์˜ ์‹œ์ž‘. XOR ๋ฌธ์ œ๋กœ ํ•œ ๋ฒˆ ์ฃฝ์—ˆ๋˜ ํผ์…‰ํŠธ๋ก ์ด ๋‹ค์ธต ๊ตฌ์กฐ์™€ ํ™œ์„ฑํ•จ์ˆ˜๋กœ ๋ถ€ํ™œํ•˜๋Š” ์ด์•ผ๊ธฐ. ๋น„์„ ํ˜•์„ฑ์ด ์™œ ๊ทธ๋ ‡๊ฒŒ ์ค‘์š”ํ•œ์ง€ ์•Œ๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

Week 8

์‹ฌ์ธต์‹ ๊ฒฝ๋ง๊ณผ ์—ญ์ „ํŒŒ

์ธต์ด ๊นŠ์–ด์ง€๋ฉด ์–ด๋–ป๊ฒŒ ํ•™์Šตํ• ๊นŒ? ์—ฐ์‡„๋ฒ•์น™์œผ๋กœ ํ’€์–ด๋‚ด๋Š” ์—ญ์ „ํŒŒ, ์‚ฌ๋ผ์ง€๋Š” ๊ธฐ์šธ๊ธฐ, ReLUยท๋“œ๋กญ์•„์›ƒยท๋ฐฐ์น˜์ •๊ทœํ™” ๊ฐ™์€ ํ˜„๋Œ€ ๋”ฅ๋Ÿฌ๋‹์˜ ํ† ๋Œ€๋“ค.

Week 9

CNN ๊ธฐ์ดˆ

์ด๋ฏธ์ง€๋ฅผ ์œ„ํ•œ ์‹ ๊ฒฝ๋ง. ํ•ฉ์„ฑ๊ณฑ์ด๋ผ๋Š” ๋‹จ์ˆœํ•œ ์—ฐ์‚ฐ์ด ์–ด๋–ป๊ฒŒ ๋ชจ์„œ๋ฆฌยท์งˆ๊ฐยท๋ฌผ์ฒด๋ฅผ ์ฐจ๋ก€๋กœ ์ฐพ์•„๋‚ด๋Š”์ง€, ๊ทธ๋ฆฌ๊ณ  LeNet์ด๋ผ๋Š” ์ฒซ ์„ฑ๊ณต ์‚ฌ๋ก€๊นŒ์ง€.

Week 10

CNN ์‹ฌํ™”์™€ ์ „์ดํ•™์Šต

AlexNet โ†’ VGG โ†’ ResNet์œผ๋กœ ์ด์–ด์ง€๋Š” ๊ฑฐ๋Œ€ ๋„คํŠธ์›Œํฌ๋“ค๊ณผ, ๋‚จ์ด ํ•™์Šต์‹œ์ผœ๋†“์€ ๋ชจ๋ธ์„ ๊ฐ€์ ธ์™€ ๋‚ด ๋ฌธ์ œ์— ๋งž๊ฒŒ ๋ฏธ์„ธ์กฐ์ •ํ•˜๋Š” ์ „์ดํ•™์Šต ์‹ค์ „.

Week 11

RNN๊ณผ LSTM

์‹œ๊ฐ„์ด ์žˆ๋Š” ๋ฐ์ดํ„ฐ(๋ง, ์Œ์•…, ์ฃผ๊ฐ€)๋ฅผ ๋‹ค๋ฃจ๋Š” ์‹ ๊ฒฝ๋ง. ๋‹จ์ˆœ RNN์˜ ํ•œ๊ณ„์™€ ๊ทธ๊ฒƒ์„ ํ‘ผ LSTM์˜ ๊ฒŒ์ดํŠธ ๊ตฌ์กฐ๋ฅผ ๊ทธ๋ฆผ์œผ๋กœ ์ดํ•ดํ•ฉ๋‹ˆ๋‹ค.

Week 12

Seq2Seq์™€ Attention

๋ฒˆ์—ญ๊ธฐ์ฒ˜๋Ÿผ ์ž…๋ ฅ ์‹œํ€€์Šค๋ฅผ ๋ฐ›์•„ ์ถœ๋ ฅ ์‹œํ€€์Šค๋ฅผ ๋งŒ๋“œ๋Š” ์ธ์ฝ”๋”-๋””์ฝ”๋” ๊ตฌ์กฐ, ๊ทธ๋ฆฌ๊ณ  ๋ชจ๋“  LLM์˜ ์–ด๋จธ๋‹ˆ์ธ ์–ดํ…์…˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜.

Week 13

Transformer์™€ LLM

RNN์„ ์™„์ „ํžˆ ๋ฒ„๋ฆฌ๊ณ  ์–ดํ…์…˜๋งŒ์œผ๋กœ ๋งŒ๋“  ํŠธ๋žœ์Šคํฌ๋จธ. ๊ทธ ์œ„์—์„œ GPTยทBERTยทChatGPT๊ฐ€ ์–ด๋–ป๊ฒŒ ์ž๋ผ๋‚ฌ๋Š”์ง€, ๊ทธ๋ฆฌ๊ณ  ์šฐ๋ฆฌ ๋ฏธ๋ž˜๋Š” ์–ด๋””๋กœ ๊ฐ€๋Š”์ง€.

6.5 ์—ญ์‚ฌ์˜ ํ๋ฆ„ โ€” ๋‹ค์„ฏ ๋ฒˆ์˜ ํŒŒ๋„

ํ•œ ํ•™๊ธฐ์— ๋ฐฐ์šธ ์ฃผ์ œ๋“ค์„ ์‹œ๊ฐ„ ์ˆœ์„œ๋กœ ํ•œ ๋ฒˆ ํ›‘์œผ๋ฉด ํฐ ๊ทธ๋ฆผ์ด ์žกํž™๋‹ˆ๋‹ค. ์ด ๋ถ„์•ผ๋Š” ํฌ๊ฒŒ ๋‹ค์„ฏ ๋ฒˆ์˜ ํŒŒ๋„๋ฅผ ํƒ€๊ณ  ์—ฌ๊ธฐ๊นŒ์ง€ ์™”์Šต๋‹ˆ๋‹ค.

  1. 1950โ€“1960๋…„๋Œ€ โ€” ์ƒ์ง•์ฃผ์˜์™€ ํผ์…‰ํŠธ๋ก . ๋กœ์  ๋ธ”๋žซ์˜ ํผ์…‰ํŠธ๋ก (1958)์€ ๋‹จ์ผ ๋‰ด๋Ÿฐ ๋ชจ๋ธ๋กœ, ๊ฐ„๋‹จํ•œ ํŒจํ„ด์„ ํ•™์Šตํ•  ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ ํฐ ์ฃผ๋ชฉ์„ ๋ฐ›์•˜์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ XOR์„ ํ’€ ์ˆ˜ ์—†๋‹ค๋Š” ํ•œ๊ณ„๊ฐ€ ๋“œ๋Ÿฌ๋‚˜๋ฉฐ(๋ฏผ์Šคํ‚ค-ํŒŒํผํŠธ 1969) ์ฒซ ๊ฒจ์šธ์ด ์˜ต๋‹ˆ๋‹ค.
  2. 1980โ€“1990๋…„๋Œ€ โ€” ์—ญ์ „ํŒŒ์™€ ํ†ต๊ณ„์  ํ•™์Šต์˜ ๋ถ€์ƒ. 1986๋…„ ๋ฃจ๋ฉœํ•˜ํŠธยทํžŒํŠผยท์œŒ๋ฆฌ์—„์Šค๊ฐ€ ์—ญ์ „ํŒŒ๋ฅผ ๋Œ€์ค‘ํ™”ํ•˜๋ฉฐ ๋‹ค์ธต ์‹ ๊ฒฝ๋ง์ด ๋ถ€ํ™œํ•˜์ง€๋งŒ, ๋™์‹œ์— Vapnik์˜ SVM๊ณผ Breiman์˜ ๋žœ๋คํฌ๋ ˆ์ŠคํŠธ ๊ฐ™์€ ํ†ต๊ณ„์  ๋ฐฉ๋ฒ•๋“ค์ด ๋” ๊น”๋”ํ•œ ์ˆ˜ํ•™๊ณผ ์ด๋ก ์  ๋ณด์žฅ์„ ๋‚ด์„ธ์šฐ๋ฉฐ ์ฃผ๋ฅ˜๊ฐ€ ๋ฉ๋‹ˆ๋‹ค. ์‹ ๊ฒฝ๋ง์€ ๋˜ ํ•œ ๋ฒˆ ๋ณ€๋ฐฉ์œผ๋กœ ๋ฐ€๋ ค๋‚ฉ๋‹ˆ๋‹ค.
  3. 2006โ€“2011๋…„ โ€” ์‚ฌ์ „ํ•™์Šต์˜ ์‹คํ—˜. ํžŒํŠผ ๊ทธ๋ฃน์ด RBM(Restricted Boltzmann Machine)๊ณผ deep belief network๋กœ "๊นŠ์€ ๋ง๋„ ์ธต๋ณ„ ์‚ฌ์ „ํ•™์Šตํ•˜๋ฉด ํ•™์Šต ๊ฐ€๋Šฅํ•˜๋‹ค"๋Š” ํžŒํŠธ๋ฅผ ๋‚ด๋†“์Šต๋‹ˆ๋‹ค. ์ด ์‹œ๊ธฐ๋ถ€ํ„ฐ "Deep Learning"์ด๋ผ๋Š” ๋ธŒ๋žœ๋“œ๊ฐ€ ์กฐ๊ธˆ์”ฉ ์“ฐ์ด๊ธฐ ์‹œ์ž‘ํ•ฉ๋‹ˆ๋‹ค.
  4. 2012โ€“2017๋…„ โ€” ์ปจ๋ณผ๋ฃจ์…˜์˜ ํ™ฉ๊ธˆ๊ธฐ. AlexNet(2012), VGG(2014), GoogLeNet(2014), ResNet(2015), DenseNet(2017)๋กœ ์ด์–ด์ง€๋Š” CNN ํญ์ฃผ ์‹œ๊ธฐ. ์ด๋ฏธ์ง€๋„ท ์—๋Ÿฌ์œจ์€ 26%์—์„œ 3% ์ดํ•˜๋กœ ๋–จ์–ด์ง€๋ฉฐ ์‚ฌ๋žŒ๋ณด๋‹ค ์ž˜ ๋ถ„๋ฅ˜ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ์ด ํ๋ฆ„์€ W9ยทW10์—์„œ ์ž์„ธํžˆ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
  5. 2017โ€“ํ˜„์žฌ โ€” ํŠธ๋žœ์Šคํฌ๋จธ์™€ LLM. 2017๋…„ "Attention Is All You Need" ๋…ผ๋ฌธ์ด RNN ์—†์ด ์–ดํ…์…˜๋งŒ์œผ๋กœ ๋ฒˆ์—ญ ์ตœ๊ณ  ์„ฑ๋Šฅ์„ ๋ƒ…๋‹ˆ๋‹ค. 2018๋…„ BERT, ๊ฐ™์€ ํ•ด GPT-1, 2020๋…„ GPT-3, 2022๋…„ ChatGPT๋กœ ์ด์–ด์ง€๋ฉฐ ์–ธ์–ดยท๋น„์ „ยท๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ์ด ํ†ตํ•ฉ๋ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” W13์—์„œ ๊ทธ ๋‚ด๋ถ€๋ฅผ ๋œฏ์–ด๋ณผ ๊ฒ๋‹ˆ๋‹ค.

์ด ๋‹ค์„ฏ ํŒŒ๋„๋Š” ์„œ๋กœ ๋‹จ์ ˆ๋œ ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ์ด์ „ ์•„์ด๋””์–ด๊ฐ€ ์‚ด์•„๋‚จ์•„ ๋‹ค์Œ ํŒŒ๋„์˜ ๋ถ€ํ’ˆ์ด ๋˜๋Š” ํ˜•ํƒœ๋กœ ์ด์–ด์ง‘๋‹ˆ๋‹ค. ๋กœ์  ๋ธ”๋žซ์˜ ๋‹จ์ผ ๋‰ด๋Ÿฐ์€ ์ง€๊ธˆ๋„ ์™„์ „์—ฐ๊ฒฐ์ธต์˜ ๊ธฐ๋ณธ ๋‹จ์œ„์ด๊ณ , 1986๋…„์˜ ์—ญ์ „ํŒŒ๋Š” ์˜ค๋Š˜๋‚  PyTorch์˜ .backward() ํ•œ ์ค„๋กœ ์ˆจ์–ด ์žˆ์œผ๋ฉฐ, SVM์˜ ์ปค๋„ ํŠธ๋ฆญ์€ ํ˜„๋Œ€ ํŠธ๋žœ์Šคํฌ๋จธ์˜ ์–ดํ…์…˜ ์ ์ˆ˜์™€ ์ˆ˜ํ•™์ ์œผ๋กœ ๋‹ฎ์•„ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜›๋‚  ์•„์ด๋””์–ด๋ฅผ ์•ˆ๋‹ค๋Š” ๊ฒƒ์€ ์œ ๋ฌผ ์ˆ˜์ง‘์ด ์•„๋‹ˆ๋ผ ํ˜„๋Œ€ ๊ธฐ๋ฒ•์˜ DNA๋ฅผ ์ดํ•ดํ•˜๋Š” ์ผ์ž…๋‹ˆ๋‹ค.

7. ํ•œ ํ•™๊ธฐ ๊ณต๋ถ€๋ฒ• โ€” ์†์ด ๋จผ์ €์—ฌ์•ผ ํ•œ๋‹ค

๋จธ์‹ ๋Ÿฌ๋‹์€ ์ˆ˜ํ•™ยทํ”„๋กœ๊ทธ๋ž˜๋ฐยท๋ฐ์ดํ„ฐ ๊ฐ๊ฐ์ด ์„ธ ๋‹ค๋ฆฌ๋กœ ๋ฐ›์น˜๋Š” ๋ถ„์•ผ์ž…๋‹ˆ๋‹ค. ํ•œ ๋‹ค๋ฆฌ๋ผ๋„ ์งง์œผ๋ฉด ์˜์ž๊ฐ€ ๊ธฐ์šฐ๋šฑํ•ฉ๋‹ˆ๋‹ค. ๊ฐ•์˜๋ฅผ ๋“ค์„ ๋•Œ๋งˆ๋‹ค ๋ฐ˜๋“œ์‹œ ์†์œผ๋กœ ์ฝ”๋“œ๋ฅผ ๋Œ๋ ค๋ณด๊ธธ ๊ถŒํ•ฉ๋‹ˆ๋‹ค. ๊ฐœ๋…์„ ์ฝ์œผ๋ฉด "์•Œ ๊ฒƒ ๊ฐ™๋‹ค"๋Š” ์ฐฉ๊ฐ์ด ์‰ฝ๊ฒŒ ์˜ค๋Š”๋ฐ, ์‹ค์ œ๋กœ numpy ๋ฐฐ์—ด ํฌ๊ธฐ๋ฅผ ๋งž์ถ”๊ณ  NaN์„ ๋””๋ฒ„๊น…ํ•˜๊ณ  loss๊ฐ€ ๋ฐœ์‚ฐํ•˜๋Š” ์žฅ๋ฉด์„ ๋ณด๊ณ  ๋‚˜์„œ์•ผ "์ง„์งœ ์•Ž"์ด ์ž๋ฆฌ์žก์Šต๋‹ˆ๋‹ค. ์ด ์ˆ˜์—…์˜ ๋ชจ๋“  ํŽ˜์ด์ง€์— ์ธํ„ฐ๋ž™ํ‹ฐ๋ธŒ ๋ฐ๋ชจ๊ฐ€ ์žˆ๋Š” ์ด์œ ๋„ "๋ˆˆ์œผ๋กœ ๋งŒ์ ธ๋ณด๊ธฐ" ์œ„ํ•จ์ž…๋‹ˆ๋‹ค.

์ˆ˜ํ•™์€ ๊ฒ๋จน์ง€ ๋ง๋˜ ํ”ผํ•˜์ง€๋„ ๋งˆ์‹ญ์‹œ์˜ค. ์šฐ๋ฆฌ๋Š” ์„ ํ˜•๋Œ€์ˆ˜(ํ–‰๋ ฌ๊ณฑยท๊ณ ์œณ๊ฐ’), ๋ฏธ์ ๋ถ„(ํŽธ๋ฏธ๋ถ„ยท์—ฐ์‡„๋ฒ•์น™), ํ™•๋ฅ (๊ธฐ๋Œ“๊ฐ’ยท๋ฒ ์ด์ฆˆ ๊ทœ์น™) ์„ธ ์˜์—ญ์„ ์–•๊ฒŒ ๋˜๋Š” ๊นŠ๊ฒŒ ๊ณ„์† ์“ธ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋ชจ๋ฅด๋Š” ๊ธฐํ˜ธ๊ฐ€ ๋‚˜์™€๋„ ๋‹นํ™ฉํ•˜์ง€ ๋ง๊ณ , ๊ทธ ์ž๋ฆฌ์—์„œ ์ž‘์€ ์˜ˆ์ œ๋กœ ์ˆซ์ž๋ฅผ ๋Œ€์ž…ํ•ด ๋ณด๋ฉด ๊ฑฐ์˜ ํ•ญ์ƒ ์‹ค์ฒด๊ฐ€ ๋ณด์ž…๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€ $\mathbf{w}^\top \mathbf{x}$๊ฐ€ ๋‚ฏ์„ค๋ฉด $\mathbf{w}=[2,3]$, $\mathbf{x}=[1,4]$๋กœ ๊ณ„์‚ฐํ•ด ๋ณด์„ธ์š” โ€” $2\cdot 1 + 3\cdot 4 = 14$, ๊ทธ๋ฟ์ž…๋‹ˆ๋‹ค.

๋งˆ์ง€๋ง‰์œผ๋กœ, ๋จธ์‹ ๋Ÿฌ๋‹์€ ๋ณธ์งˆ์ ์œผ๋กœ ์ผ๋ฐ˜ํ™”์˜ ํ•™๋ฌธ์ž…๋‹ˆ๋‹ค. "ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋ฅผ ์ž˜ ๋งž์ถ”๋Š” ๊ฒƒ"๊ณผ "๋ณธ ์  ์—†๋Š” ๋ฐ์ดํ„ฐ์—๋„ ์ž˜ ์ž‘๋™ํ•˜๋Š” ๊ฒƒ"์€ ์ „ํ˜€ ๋‹ค๋ฅธ ๋ฌธ์ œ์ด๊ณ , ํ•™๊ธฐ ๋‚ด๋‚ด ์šฐ๋ฆฌ๊ฐ€ ์‹ธ์šฐ๊ฒŒ ๋  ๊ฐ€์žฅ ํฐ ์ ์€ ๊ณผ์ ํ•ฉ(overfitting)์ž…๋‹ˆ๋‹ค. ์ด ๋‹จ์–ด๋Š” ๋งค์ฃผ ๋Œ์•„์˜ฌ ๊ฒƒ์ด๋‹ˆ ๋ฏธ๋ฆฌ ์นœํ•ด์ ธ ๋‘์„ธ์š”.

๐Ÿ“– ๋” ๊นŠ์ด ๊ณต๋ถ€ํ•˜๊ธฐ