์ฌํํ๋ก์ ํธ : ํ๊ท๋ถ์์ ํ์ฉํ ์๋งํธ ์ฃผ๊ฐ ํ๋งค๋ ์์ธก
๐ค ๋จธ์ ๋ฌ๋ : ํ์ดํผํ๋ผ๋ฏธํฐ ์กฐ์
์ด ๋ถ๋ถ์ ์ง์ ์งํํ์ง ์์์ง๋ง, ์ฝ๊ฐ ์์ฝํด์ ์ ์ด๋๊ฒ ์..!
์์ ๋ณ์ ์ ํ ๋จ๊ณ์์ ์ฑ๋ฅ์ด ๊ฐ์ฅ ์ข์๋ model_rf7๊ณผ model_xgb7 ๋๊ฐ์ง๋ฅผ ์ ํํด ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ์กฐ์ ํด๋ณด์๋ค. ๋๋คํฌ๋ ์คํธ ๋ฟ ์๋๋ผ Xgboost๋ ํจ๊ป ์งํํ ์ด์ ๋ ๋ ๋ค์ํ ๊ฒฝ์ฐ์ ์๋ฅผ ์ดํด๋ณด๊ธฐ ์ํด์์๋ค.
- rf8๋จ๊ณ์์ ๋๋ค์์น ๊ฒฐ๊ณผ์ธ ์ต์ ํํ ํ๋ผ๋ฏธํฐ ์ฌ์ฉ์ ์ ๋ฐ์ ์ผ๋ก ์ฑ๋ฅ์ด ํฌ๊ฒ ์ ํ๋์๋ค. → ๋ฐ๋ผ์ ํ๋ผ๋ฏธํฐ๋ฅผ ์กฐ์ ํ์ง ์์ rf7์ xgboost์ best model๊ณผ ๋น๊ตํ๊ธฐ๋ก ํ๋ค.
- Xgb 8์์ ๊ทธ๋ฆฌ๋ ์์น ๊ฒฐ๊ณผ๋ฅผ ๋ฐ์ํด max_depth & n_estimators๋ฅผ ์กฐ์ ํ๋ค. ๊ทธ ์ํฅ์ผ๋ก ๋น์ฝ์ ์ธ ์ฑ๋ฅ ์์น์ด ์์๋ค. Xgb 9์์ ์ฑ๋ฅ ์์น์ ์ํด n_estimators๋ฅผ ํค์ฐ๊ณ , ๊ณผ์ ํฉ ๋ฐฉ์ง ๋ชฉ์ ์ผ๋ก alpha, lambda๋ฅผ ํตํด L1, L2 ๊ท์ ํ ๊ฒฐ๊ณผ ์ฑ๋ฅ์ด ๋์ฑ ๊ฐ์ ๋์๋ค.
๐ ์ต์ข ๋ชจ๋ธ ์ ์
์ ํ๋ ๋ณ์ | CPI_sd, Dept, IsHoliday_le, Size_sd, Store, Temperature_sd, Unemployment_sd, Week, Year
์ ๊ทํ | ์ผ๋ถ ๋ณ์(Store, Dept) ์ ์ธ Sklearn.preprocessing.Standard Scaler ํ์ฉ
์ธ์ฝ๋ฉ | IsHoliday ๋ผ๋ฒจ ์ธ์ฝ๋ฉ
๋ชจ๋ธ | Xgboost
ํ์ดํผํ๋ผ๋ฏธํฐ | colsample_bytree =0.9 , learning_rate =0.3, max_depth =10, min_child_weight =5, n_estimators=1000 , lambda=10, alpha=2
๐ ๋์๋ณด๋ ๊ธฐํ
Datapane์ผ๋ก ๊ฐ ์ง์ ๋ณ ์ ์ฅ์๊ฒ ์ ๊ณต๋ ์ฃผ๊ฐ๋ณด๊ณ ์์ฉ ๋์๋ณด๋๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ๊ธฐํํ๋ค. (์๋ณธ์ ๊ธ์จ๊ฐ ์๋ง์ด๋ผ ๋ค์ ์ ์ด๋์์.)
์ค์ง์ ์ผ๋ก ๊ตฌํ์ด ๊ฐ๋ฅํ๊ฐ์ ๋ํด์ ์๊ฐํ๊ธฐ ๋ณด๋ค๋, ์ฃผ๊ฐ ๋ณด๊ณ ์์ ์ด๋ค ๋ด์ฉ์ด ๋ค์ด๊ฐ์ผํ๋์ง๋ฅผ ์ค์ ์ ์ผ๋ก ๊ธฐํํ๋ค.
๐ง๐ซ PPT ์ ์