LG Aimers

[Machine Learning] Bias & Variance

parkjiu 2024. 1. 30. 11:21
ML์— ๋Œ€ํ•œ ์ผ๋ฐ˜์  ์ •์˜

 

Model class๋ฅผ ์„ ํƒํ•œ ํ›„, ํ•™์Šต๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ๋ชจ๋ธ์ด ์ž˜ ๋™์ž‘ํ•˜๋„๋ก ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฒฐ์ •ํ•ด์•ผ ํ•จ.

์ž˜ ๋™์ž‘ํ•˜๋ ค๋ฉด ์†์‹คํ•จ์ˆ˜๋ฅผ ์„ค์ •ํ•ด์•ผ ํ•œ๋‹ค. ์—ฌ๊ธฐ์„œ ์†์‹คํ•จ์ˆ˜๋ž€ ๋ชจ๋ธ์˜ ์˜ˆ์ธก๊ฐ’๊ณผ ์ •๋‹ต ๊ฐ’์ด ํ‹€๋ฆด ์ˆ˜๋ก ํฐ ๊ฐ’์„ ์ฃผ๋Š” ํ•จ์ˆ˜๋ฅผ ๋งํ•œ๋‹ค.

squared loss๋ž€ ์˜ˆ์ธก๊ฐ’๊ณผ ์ •๋‹ต๊ฐ’์ด ํ‹€๋ฆด ์ˆ˜๋ก 2์ฐจ์˜ ํ•จ์ˆ˜๋กœ ํŒจ๋„ํ‹ฐ ์ฃผ๋Š” ์†์‹ค ํ•จ์ˆ˜๋ฅผ ๋งํ•˜๋ฉฐ, ์ด๋ฅผ ์ •์˜ํ•  ์ˆ˜ ์žˆ๋‹ค.

classification์ด๋ž€ ์ด์ง„ ๋ถ„๋ฅ˜๋กœ loss๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ๊ฒƒ์œผ๋กœ, ๋งž์œผ๋ฉด 0, ํ‹€๋ฆฌ๋ฉด 1์„ ์ค€๋‹ค.

์ด๋ ‡๊ฒŒ loss funcion์„ ๊ฒฐ์ •ํ•˜๋ฉด ์ตœ์ ํ™” ๋ฌธ์ œ๋กœ ๊ฒฐ์ • ๊ฐ€๋Šฅ.

์ตœ์ข…์ ์œผ๋กœ ์†์‹ค์„ ์ตœ์†Œํ™”ํ•˜๋Š” w, b๋ฅผ ์ฐพ๊ณ  ์ผ๋ฐ˜ํ™”ํ•˜๋Š” ๊ฒƒ์ด ๋ชฉํ‘œ์ด๋‹ค.

 

์ผ๋ฐ˜ํ™”

 

์‚ฌ์†Œํ•œ ์˜ค๋ฅ˜์— ๊ณผํ•˜๊ฒŒ ์ ํ•ฉํ•˜๊ฒŒ ๋˜๋ฉด ์˜ค๋ฒ„ํ”ผํŒ…์ด ๋‚จ. ์ผ๋ฐ˜ํ™”๊ฐ€ ๋˜์ง€ ์•Š๋Š”๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ๊ทธ๋Ÿฌ๋ฉด ์–ด๋–ป๊ฒŒ ์ผ๋ฐ˜ํ™”๋ฅผ ํ•  ์ˆ˜ ์žˆ์„๊นŒ?

์ฒซ๋ฒˆ์งธ ๋ชฉํ‘œ = overfitting์„ ๋‚ด๋Š” ๊ฒƒ

์ด๋ฅผ ํ†ตํ•ด ์–ธ์ œ ์ œ์ผ ์ž˜ ๋˜๋Š”์ง€, ์–ธ์ œ Error๊ฐ€ ์ œ์ผ ์ค„์–ด๋“œ๋Š” ์ง€๋ฅผ ์•Œ ์ˆ˜ ์žˆ์Œ. ์ดํ›„ Validation์ด๋‚˜ Test error์„ ๋‚ฎ์ถ”๋Š” ๊ณผ์ •์œผ๋กœ ๊ธฐ๊ณ„ํ•™์Šต์ด ์ง„ํ–‰๋œ๋‹ค.

 

๋ชจ๋ธ์˜ ์šฉ๋Ÿ‰.

 

๋ชจ๋ธ์˜ ์šฉ๋Ÿ‰์€ ์ ์ ˆํ•ด์•ผ ํ•จ. ์šฉ๋Ÿ‰์ด ๋„ˆ๋ฌด ํฌ๋ฉด, ์ฆ‰ ์ฐจ์ˆ˜๊ฐ€ ๋„ˆ๋ฌด ํฌ๋ฉด ๋ฐ์ดํ„ฐ๊ฐ€ ์—†๋Š” ๋ถ€๋ถ„์—์„œ ๊ตด๊ณก, ์—…๋‹ค์šด์ด ์‹ฌํ•œ ๋ชจ์Šต์„ ๋ณผ ์ˆ˜ ์žˆ์Œ. 

์ข€ ๋” ์ž‘์€ ์ฐจ์ˆ˜์˜ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๋ฉด ๋ฐ์ดํ„ฐ ์—†๋Š” ๊ตฌ๊ฐ„์ด ๋ถ€๋“œ๋Ÿฝ๊ฒŒ ๋ณ€ํ•จ. ๊ฐ„๋‹จํ•œ ๋ชจ๋ธ์„ ์„ ํƒํ•˜๋Š” ๊ฒƒ์ด ๊ตด๊ณก์ด ์‹ฌํ•˜์ง€ ์•Š์„ ํ™•๋ฅ ์ด ๋†’๋‹ค.

๋ชจ๋ธ์˜ ์šฉ๋Ÿ‰์ด ๋Š˜์–ด๋‚˜๋ฉด ํ•™์Šต ์—๋Ÿฌ๋Š” ๋ฌด์กฐ๊ฑด ๋”์šฑ ๋‚ฎ์•„์ง„๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ผ๋ฐ˜ํ™” ์˜ค๋ฅ˜๋ฅผ ์ค„์ด๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ ์ ˆํ•œ ์šฉ๋Ÿ‰์„ ์ฐพ์•„์•ผ ํ•จ. 

๊ต์ฐจ ๊ฒ€์ฆ์„ ํ•ด์„œ ํ•™์Šต ์˜ค์ฐจ๋ฅผ ์˜ˆ์ธกํ•ด ๋ด„์œผ๋กœ์จ ์ ์ ˆํ•œ ์šฉ๋Ÿ‰์„ ์ฐพ์„ ์ˆ˜ ์žˆ๋‹ค.

 

์ •๊ทœํ™”

 

๋ชฉ์ ํ•จ์ˆ˜๋Š” ์ฃผ๋กœ ํ•™์Šต๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์˜ค์ฐจ๊ฐ€ ์ตœ์†Œํ™”๋˜๋„๋ก ์ •์˜. ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ๋Š” ์šฐ๋ฆฌ๊ฐ€ ์ง€์ •ํ•˜๋Š” ๊ฒƒ. ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ์ธ ๋žŒ๋‹ค๋ฅผ ์ž‘๊ฒŒ ์ฃผ๋ฉด ์ฒซ๋ฒˆ์งธ term์„ ๋” ์ค‘์š”ํ•˜๊ฒŒ ์—ฌ๊ธฐ๊ณ , ๋žŒ๋‹ค๋ฅผ ํฌ๊ฒŒ ์ฃผ๋ฉด ๋‘๋ฒˆ์งธ term์„ ๋” ์ค‘์š”ํ•˜๊ฒŒ ์—ฌ๊ธด๋‹ค. ํŠœ๋‹ ํŒŒ๋ผ๋ฏธํ„ฐ๋Š” ๊ต์ฐจ๊ฒ€์ฆ์„ ํ†ตํ•ด ๊ฒฐ์ •ํ•œ๋‹ค. ์ •๊ทœํ™”์˜ ๋ชฉํ‘œ๋Š” ์ด๋ฅผ ์ถ”๊ฐ€ํ•จ์œผ๋กœ์จ ์ผ๋ฐ˜ํ™” ์˜ค๋ฅ˜๋ฅผ ์ค„์ด๋Š” ๊ฒƒ์ด๋‹ค. 

 

์˜ˆ๋ฅผ ๋“ค์–ด 9์ฐจ์ˆ˜ ํ•จ์ˆ˜์—ฌ๋„ ๋žŒ๋‹ค๋ฅผ ํฌ๊ฒŒ ์ฃผ๋ฉด ์„ ํ˜•ํ•จ์ˆ˜๊ฐ€ ๋  ์ˆ˜ ์žˆ๊ณ , ์ ์ ˆํ•˜๊ฒŒ ์ฃผ๋ฉด smoothํ•ด์ง€๊ณ , ๋žŒ๋‹ค๋ฅผ ์ž‘๊ฒŒ ์ฃผ๋ฉด ์˜ค๋ฒ„ํ”ผํŒ…์ด ๋‚  ์ˆ˜ ์žˆ์Œ. ์ด๋ ‡๊ฒŒ ์ ์ ˆํ•˜๊ฒŒ ์ฃผ๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•จ.

 

'LG Aimers' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

[Machine Learning] ML ๊ฐœ์š”  (0) 2024.01.16