240613 Today I Learn
์ด๋ ต๋ค..โ
์ ํํ๊ท
ํด์์ ์ผ๋ก(์ํ์ ์ผ๋ก) ๊ตฌํ๊ธฐ
- ์ ๊ท๋ฐฉ์ ์ (Normal Equation)
- sklearn์ Linear Regeression
- ์ ๊ท๋ฐฉ์ ์ ๋ณด๋ค ๋์ฑ ์ผ๋ฐํ๋ ๋ฐฉ๋ฒ
- ํต๊ณํ์์ ๋ฐฐ์ฐ๋ Least Squares์ ๊ฐ์
- ์ ํ๋์์์ ๋ฐฐ์ฐ๋ SVD(Singular Value Decomposition) ๊ณ์ฐ์ ์ํํ๋ ์ ์ฌ์ญํ๋ ฌ์ ๊ณ์ฐํ๋ ๊ฒ์ด๋ผ๊ณ ๋ ๋ณผ ์ ์์
๊ฒฝ์ฌํ๊ฐ๋ฒ์ผ๋ก ๊ตฌํ๊ธฐ
๐ก ๊ฒฝ์ฌํ๊ฐ๋ฒ
๊ธฐ์ธ๊ธฐ๋ฅผ ์ด์ฉํด์ ํ๋ผ๋ฏธํฐ๋ฅผ ํ์ตํ๋ ๋ฐฉ๋ฒ
- Batch : ํ์ต ๋ฐ์ดํฐ ์ ๋ถ ๋ค ๊ธฐ์ธ๊ธฐ๋ฅผ ๊ตฌํ๋ ๊ฒ
- SGD : ๋๋ค์ผ๋ก 1๊ฐ๋ง ๊ณจ๋ผ์ ๊ธฐ์ธ๊ธฐ๋ฅผ ๊ตฌํ๋ ๊ฒ, ๋์ ๋ถ์์ ํจ
- Mini-Batch : ํ์ต ๋ฐ์ดํฐ ์ผ๋ถ์ ๋ํด์ ๋ฌถ์ด ๊ธฐ์ธ๊ธฐ๋ฅผ ๊ตฌํ๋ ๊ฒ
- ํน์ฑ์ด ๋ง๊ณ ๋ฐ์ดํฐ ๊ฐ์๊ฐ ๋ง์ ๋ ์ ํฉํ ๋ฐฉ๋ฒ
- ์ค์ฐจ๋ฅผ ์ต์ํ ํ๋ ๋ฐฉํฅ์ผ๋ก ํ์ต
- Learning rate (step size) : ํ์ตํ ๋ step์ ์ฌ์ด์ฆ
→ ์ ๋นํ ๊ฐ์ ๊ฐ์ง๋๊ฒ ์ค์ํ๋ค.
→ ์ด๊ฒ์ ๊ฒ ์๋ํด๋ณด๋ฉด๋๋ค. - ์ค์ฐจ์ ์ข
๋ฅ๋ค : MAE, MSE(RMSE), R-squared
→ MSE : ์ด์์น์ ๋ํด์ ๋ฏผ๊ฐํ๊ฒ ์ฌ์ฉํ๊ณ ์ถ์ ๋ ์ฌ์ฉ
→ R-squared : ์ค์ฐจ ๋ง๊ณ ๋ ์ถ๊ฐ์ ์ธ ์งํ๊ฐ ํ์ํ ๋ ์ฌ์ฉ
- Learning rate (step size) : ํ์ตํ ๋ step์ ์ฌ์ด์ฆ
์์๋ธ ํ์ต
๐ก ๋ฐฐ๊น (Bagging)
- train ๋ฐ์ดํฐ์์ ๋ฌด์์๋ก ๋ฝ์์ ์ฌ๋ฌ๋ฒ ๋ชจ๋ธ ํ์ต
- ๊ธฐ๋ณธ์ ์ผ๋ก ์ค๋ณต์ ํ์ฉํ๋ฉด์ ๋ฌด์์๋ก ๋ฝ์
- ๋ง์ฝ ์ค๋ณต์ ํ์ฉํ๊ณ ์ถ์ด์ ํ์ด์คํ (pasting)
- ๋ชจ๋ ์์ธก์ ํ๊ท ๋ด์ ํ๊ท ์ํ (๋ถ๋ฅ๋ ์ต๋น๊ฐ)
๐ก ๋ถ์คํ (Boosting)
๋ชจ๋ธ์ ์ฌ๋ฌ๊ฐ ์ฐ๊ฒฐํ์ฌ ๊ฐํ ๋ชจ๋ธ์ ๋ง๋ฆ
- ์์ด๋ค ๋ถ์คํธ
- ์ด์ ์ ์ ๋ง์ถ์ง ๋ชปํ ๋ฐ์ดํฐ์ ๋ํด ๊ฐ์ค์น ๋์
- ๊ทธ๋ฌ๋ฉด ๋ค์ ๋ชจ๋ธ์์ ์ ๋ง์ถ์ง ๋ชปํ ๋ฐ์ดํฐ์ ์ง์คํด์ ๋์ฑ ํ์ตํ๊ฒ ๋จ
- ๊ทธ๋๋์ธํธ ๋ถ์คํธ
- ๊ฐ์ค์น๋ฅผ ์กฐ์ ํ๋ ๊ฒ์ด ์๋ ์ด์ ๋ชจ๋ธ์ ์ค์ฐจ์ ๋ณด๋ฅผ ๋ค์ ๋ชจ๋ธ์ input์ผ๋ก ์ง์ด๋ฃ์
์์๋ธ ๊ธฐ๋ฒ
1. ์์ฌ๊ฒฐ์ ํธ๋ฆฌ๊ฐ ๋ฐฐ๊น ์ ๋ง๋๋ฉด? → ๋๋คํฌ๋ ์คํธ
- n_estimators : ๊ฒฐ์ ํธ๋ฆฌ์ ๊ฐ์
- ๊ธฐ๋ณธ๊ฐ = 100
- ๋์ ์๋ก ์ฑ๋ฅ์ด ์ข์์ง ์ ์์ง๋ง ๊ณ์ฐ๋น์ฉ๋ ํจ๊ป ์ฆ๊ฐ
- max_depth : ๊ฐ ํธ๋ฆฌ์ ์ต๋ ๊น์ด๋ฅผ ์ง์
- ๊ฐ์ด ํด์๋ก ํธ๋ฆฌ๋ ๋ ๊น์ด์ง๊ณ ๋ณต์กํด์ง
2. ์์ฌ๊ฒฐ์ ํธ๋ฆฌ๊ฐ ๊ทธ๋๋์ธํธ ๋ถ์คํ ์ ๋ง๋๋ฉด? → GradientBoostingRegressor(GBRT)
3. ์์ฌ๊ฒฐ์ ํธ๋ฆฌ๊ฐ ์ต์ ํ๋ ๊ทธ๋๋์ธํธ ๋ถ์คํ ์ผ๋ก ์ ๊ทธ๋ ์ด๋ ํ๋ฉด? → XGBoost
- ๋งค์ฐ ๋น ๋ฅธ ์๋, ํ์ฅ์ฑ, ๊ท์ ๋ฅผ ์๋์ผ๋ก ์ฌ์ฉ, ๊ฒฐ์ธก๊ฐ์ ์๋์ผ๋ก ์ฒ๋ฆฌ
- ๋จธ์ ๋ฌ๋ ๊ฒฝ์ง๋์ธ์์ ์ฐ์น ํ๋ณด๋ค์ด ์ฌ์ฉํ๋ ์ค์ ๋ชจ๋ธ
'๐ Today I Learn > ๐ Python' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Spark๋ฅผ ์ด์ฉํ ๋น ๋ฐ์ดํฐ ๋ถ์ (1) (1) | 2024.07.17 |
---|---|
๋จธ์ ๋ฌ๋ ํน๊ฐ #3 ๊ตฐ์งํ(Clustering) (0) | 2024.06.15 |
[๊ฐ์ธ ๊ณผ์ ] ๋จธ์ ๋ฌ๋ ๊ฐ์ธ๊ณผ์ (1) | 2024.06.13 |
๋จธ์ ๋ฌ๋์ ์ดํด์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ํ์ฉ (7) ๋ฅ๋ฌ๋ (1) | 2024.06.13 |
๋จธ์ ๋ฌ๋ ํน๊ฐ #1 ๋ถ๋ฅ(Clasification) (0) | 2024.06.12 |