LG Aimers

[Machine Learning] ML ๊ฐœ์š”

parkjiu 2024. 1. 16. 15:23

<๊ธฐ๊ณ„ํ•™์Šต์˜ ์ •์˜>

์ธ๊ณต์ง€๋Šฅ์˜ ํ•œ ๋ถ„์•ผ. ์ธ๊ณต์ง€๋Šฅ์—๋Š” ๊ธฐ๊ณ„ํ•™์Šต, ์ปดํ“จํ„ฐ ๋น„์ „, ์ž์–ธ์–ด์ฒ˜๋ฆฌ, ๋กœ๋ณดํ‹ฑ์Šค ๋“ฑ์ด ํฌํ•จ๋จ. ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ์Šค์Šค๋กœ ๋ฐœ์ „ํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋‹ค๋ฃจ๋Š” ํ•™๋ฌธ. ๋”ฅ๋Ÿฌ๋‹์€ ๊ธฐ๊ณ„ํ•™์Šต ์ค‘ ์‹ ๊ฒฝ๋ง ์ค‘ layer๊ฐ€ ๋งŽ์€ ์‹ ๊ฒฝ๋ง์„ ์“ฐ๋Š” ๋ถ„์•ผ.

 

<๋จธ์‹ ๋Ÿฌ๋‹์˜ ์ •์˜ : T, P, E>

T = Task : ๊ธฐ๊ณ„ํ•™์Šต์œผ๋กœ ๋ฌด์—‡์„ ํ•  ๊ฒƒ์ธ์ง€

P = Performance measure : ์„ฑ๋Šฅ์ง€ํ‘œ๋Œ€๋กœ ํ‰๊ฐ€ํ•จ. ์–ด๋–ค ์„ฑ๋Šฅ์ง€ํ‘œ ์‚ฌ์šฉํ•  ๊ฒƒ์ธ์ง€. 

E = Experience -> ๋ฐ์ดํ„ฐ๋ฅผ ๋งํ•จ. ์–ด๋–ค ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•  ๊ฒƒ์ธ์ง€.

 

๊ธฐ๊ณ„ํ•™์Šต์˜ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ๊ฐœ๋…๊ณผ ๋ชฉํ‘œ๋Š” ์ผ๋ฐ˜ํ™”.

์—ฌ๋Ÿฌ๊ฐ€์ง€๋ฅผ ๋ณด๊ณ  ์œ ์‚ฌ์„ฑ์„ ์ฐพ์•„๋‚ด์–ด ํ•˜๋‚˜์˜ ํ”„๋กœํ† ํƒ€์ž…์„ ๋งŒ๋“ค๊ณ  ์ผ๋ฐ˜ํ™”๋ฅผ ํ•จ. ์ถ”์ƒํ™” ๊ณผ์ •. ์ด๊ฒƒ์ด ๋” ๋ฐœ์ „ํ•ด์„œ Generative algorithem์ด ๋จ. 

 

<No Free Lunch Theorem for ML>

Task์— ๋”ฐ๋ผ ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ๋‹ฌ๋ผ์ง„๋‹ค. ๊ทธ๋ž˜์„œ ํ•˜๋‚˜์˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ๋ชจ๋“  ๊ฒฝ์šฐ์— ๋‹ค ์ข‹์„ ์ˆ˜ ์—†๋‹ค.

 

<ํ•™์Šต์˜ ์ข…๋ฅ˜>

1. ์ง€๋„ํ•™์Šต(supervised learning)

2. ๋น„์ง€๋„ํ•™์Šต(unsupervised learning)

3. ์ค€์ง€๋„ํ•™์Šต(semi-supervised learning)

4. ๊ฐ•ํ™”ํ•™์Šต(reinforcement learnig)

 

[์ง€๋„ํ•™์Šต]

- input & output ์Œ์„ ๋งŒ๋“ค์–ด์„œ ํ•™์Šต๋ฐ์ดํ„ฐ๋กœ ๋งŒ๋“ค์–ด ๊ธฐ๊ณ„ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ•™์Šต์‹œํ‚ด. 

- classification ๊ณผ regression. regression์‹œ y๋Š” ์‹ค์ˆ˜, x๋Š” ๋ฒกํ„ฐ๋ฅผ ์ด๋ฃธ.

[๋น„์ง€๋„ํ•™์Šต]

-ํ•™์Šต๋ฐ์ดํ„ฐ๊ฐ€ x๋กœ๋งŒ ์ด๋ฃจ์–ด์ ธ์žˆ์Œ.

-ํด๋Ÿฌ์Šคํ„ฐ๋ง, ์ด์ƒ์น˜ ํƒ์ง€, ํ™•๋ฅ  ๋ฐ€๋„ ์ถ”์ • 

[์ค€์ง€๋„ํ•™์Šต]

- LU learning: x,y ์Œ์„ ์ฃผ๋Š” ๊ฒƒ๋„ ์žˆ๊ณ , labeling ๋˜์ง€ ์•Š์€, x๋งŒ ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์ฃผ๋Š” ๊ฒƒ๋„ ์žˆ์Œ.

- PU learning: ํŠน์ • class์— ๋Œ€ํ•ด์„œ๋งŒ data๋ฅผ ์ฃผ๋Š” ๊ฒƒ

- ์•„๋ž˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์ด unlabeled๋œ data๋ฅผ classificationํ•˜๋Š”๋ฐ ๋„์›€์„ ์คŒ.

[๊ฐ•ํ™”ํ•™์Šต]

- Agent์™€ environment๊ฐ€ ์ƒํ˜ธ์ž‘์šฉํ•˜๋ฉด์„œ ํ”ผ๋“œ๋ฐฑ์„ ์ฃผ๊ณ  ๋ฐ›์Œ. ํ™˜๊ฒฝ์˜ ์ƒํƒœ state๋ฅผ ๋ฐ›๊ณ reward๋ฅผ ๋ฐ›์Œ. ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ๋””ํ…Œ์ผ์„ ํŒ๋‹จ. ๋ณดํ†ต state ๋ณ€ํ™”๊ฐ€ ์žˆ๊ณ  reward๋Š” ๋Š๋ฆฌ๊ฒŒ ์˜ด. ์—ฌ๋Ÿฌ๋ฒˆ ๊ณผ์ •์ด ๋ฐ˜๋ณต๋˜์–ด์•ผ reward๊ฐ€ ์˜ค๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ๊ธฐ ๋•Œ๋ฌธ์— ๋‹ค๋ฅธ ์•Œ๊ณ ๋ฆฌ์ฆ˜๋ณด๋‹ค ํ•™์Šตํ•˜๋Š”๋ฐ ๊ฑธ๋ฆฌ๋Š” ์‹œ๊ฐ„ ๋ฐ ๋‚œ์ด๋„๊ฐ€ ํ›จ์”ฌ ๋†’๋‹ค.

'LG Aimers' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

[Machine Learning] Bias & Variance  (0) 2024.01.30