ML์ ๋ํ ์ผ๋ฐ์ ์ ์
Model class๋ฅผ ์ ํํ ํ, ํ์ต๋ฐ์ดํฐ์ ๋ํด ๋ชจ๋ธ์ด ์ ๋์ํ๋๋ก ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฒฐ์ ํด์ผ ํจ.
์ ๋์ํ๋ ค๋ฉด ์์คํจ์๋ฅผ ์ค์ ํด์ผ ํ๋ค. ์ฌ๊ธฐ์ ์์คํจ์๋ ๋ชจ๋ธ์ ์์ธก๊ฐ๊ณผ ์ ๋ต ๊ฐ์ด ํ๋ฆด ์๋ก ํฐ ๊ฐ์ ์ฃผ๋ ํจ์๋ฅผ ๋งํ๋ค.
squared loss๋ ์์ธก๊ฐ๊ณผ ์ ๋ต๊ฐ์ด ํ๋ฆด ์๋ก 2์ฐจ์ ํจ์๋ก ํจ๋ํฐ ์ฃผ๋ ์์ค ํจ์๋ฅผ ๋งํ๋ฉฐ, ์ด๋ฅผ ์ ์ํ ์ ์๋ค.
classification์ด๋ ์ด์ง ๋ถ๋ฅ๋ก loss๋ฅผ ๊ฒฐ์ ํ๋ ๊ฒ์ผ๋ก, ๋ง์ผ๋ฉด 0, ํ๋ฆฌ๋ฉด 1์ ์ค๋ค.
์ด๋ ๊ฒ loss funcion์ ๊ฒฐ์ ํ๋ฉด ์ต์ ํ ๋ฌธ์ ๋ก ๊ฒฐ์ ๊ฐ๋ฅ.
์ต์ข ์ ์ผ๋ก ์์ค์ ์ต์ํํ๋ w, b๋ฅผ ์ฐพ๊ณ ์ผ๋ฐํํ๋ ๊ฒ์ด ๋ชฉํ์ด๋ค.
์ผ๋ฐํ
์ฌ์ํ ์ค๋ฅ์ ๊ณผํ๊ฒ ์ ํฉํ๊ฒ ๋๋ฉด ์ค๋ฒํผํ ์ด ๋จ. ์ผ๋ฐํ๊ฐ ๋์ง ์๋๋ค๋ ๊ฒ์ด๋ค. ๊ทธ๋ฌ๋ฉด ์ด๋ป๊ฒ ์ผ๋ฐํ๋ฅผ ํ ์ ์์๊น?
์ฒซ๋ฒ์งธ ๋ชฉํ = overfitting์ ๋ด๋ ๊ฒ
์ด๋ฅผ ํตํด ์ธ์ ์ ์ผ ์ ๋๋์ง, ์ธ์ Error๊ฐ ์ ์ผ ์ค์ด๋๋ ์ง๋ฅผ ์ ์ ์์. ์ดํ Validation์ด๋ Test error์ ๋ฎ์ถ๋ ๊ณผ์ ์ผ๋ก ๊ธฐ๊ณํ์ต์ด ์งํ๋๋ค.
๋ชจ๋ธ์ ์ฉ๋.
๋ชจ๋ธ์ ์ฉ๋์ ์ ์ ํด์ผ ํจ. ์ฉ๋์ด ๋๋ฌด ํฌ๋ฉด, ์ฆ ์ฐจ์๊ฐ ๋๋ฌด ํฌ๋ฉด ๋ฐ์ดํฐ๊ฐ ์๋ ๋ถ๋ถ์์ ๊ตด๊ณก, ์ ๋ค์ด์ด ์ฌํ ๋ชจ์ต์ ๋ณผ ์ ์์.
์ข ๋ ์์ ์ฐจ์์ ๋ชจ๋ธ์ ์ฌ์ฉํ๋ฉด ๋ฐ์ดํฐ ์๋ ๊ตฌ๊ฐ์ด ๋ถ๋๋ฝ๊ฒ ๋ณํจ. ๊ฐ๋จํ ๋ชจ๋ธ์ ์ ํํ๋ ๊ฒ์ด ๊ตด๊ณก์ด ์ฌํ์ง ์์ ํ๋ฅ ์ด ๋๋ค.
๋ชจ๋ธ์ ์ฉ๋์ด ๋์ด๋๋ฉด ํ์ต ์๋ฌ๋ ๋ฌด์กฐ๊ฑด ๋์ฑ ๋ฎ์์ง๋ค. ๊ทธ๋ฌ๋ ์ผ๋ฐํ ์ค๋ฅ๋ฅผ ์ค์ด๊ธฐ ์ํด์๋ ์ ์ ํ ์ฉ๋์ ์ฐพ์์ผ ํจ.
๊ต์ฐจ ๊ฒ์ฆ์ ํด์ ํ์ต ์ค์ฐจ๋ฅผ ์์ธกํด ๋ด์ผ๋ก์จ ์ ์ ํ ์ฉ๋์ ์ฐพ์ ์ ์๋ค.
์ ๊ทํ
๋ชฉ์ ํจ์๋ ์ฃผ๋ก ํ์ต๋ฐ์ดํฐ์ ๋ํ ์ค์ฐจ๊ฐ ์ต์ํ๋๋๋ก ์ ์. ํ์ดํผํ๋ผ๋ฏธํฐ๋ ์ฐ๋ฆฌ๊ฐ ์ง์ ํ๋ ๊ฒ. ํ์ดํผํ๋ผ๋ฏธํฐ์ธ ๋๋ค๋ฅผ ์๊ฒ ์ฃผ๋ฉด ์ฒซ๋ฒ์งธ term์ ๋ ์ค์ํ๊ฒ ์ฌ๊ธฐ๊ณ , ๋๋ค๋ฅผ ํฌ๊ฒ ์ฃผ๋ฉด ๋๋ฒ์งธ term์ ๋ ์ค์ํ๊ฒ ์ฌ๊ธด๋ค. ํ๋ ํ๋ผ๋ฏธํฐ๋ ๊ต์ฐจ๊ฒ์ฆ์ ํตํด ๊ฒฐ์ ํ๋ค. ์ ๊ทํ์ ๋ชฉํ๋ ์ด๋ฅผ ์ถ๊ฐํจ์ผ๋ก์จ ์ผ๋ฐํ ์ค๋ฅ๋ฅผ ์ค์ด๋ ๊ฒ์ด๋ค.
์๋ฅผ ๋ค์ด 9์ฐจ์ ํจ์์ฌ๋ ๋๋ค๋ฅผ ํฌ๊ฒ ์ฃผ๋ฉด ์ ํํจ์๊ฐ ๋ ์ ์๊ณ , ์ ์ ํ๊ฒ ์ฃผ๋ฉด smoothํด์ง๊ณ , ๋๋ค๋ฅผ ์๊ฒ ์ฃผ๋ฉด ์ค๋ฒํผํ ์ด ๋ ์ ์์. ์ด๋ ๊ฒ ์ ์ ํ๊ฒ ์ฃผ๋ ๊ฒ์ด ์ค์ํจ.
'LG Aimers' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Machine Learning] ML ๊ฐ์ (0) | 2024.01.16 |
---|