240612 Today I Learn๋ฅ๋ฌ๋ ์ด๋ก ๋จธ์ ๋ฌ๋ vs. ๋ฅ๋ฌ๋๐ก ๋จธ์ ๋ฌ๋๊ณผ ๋ฅ๋ฌ๋์ ๋ชจ๋ ๋ฐ์ดํฐ๋ก๋ถํฐ ๊ฐ์ค์น๋ฅผ ํ์ตํ์ฌ ํจํด์ ์ธ์ํ๊ณ ๊ฒฐ์ ์ ๋ด๋ฆฌ๋ ์๊ณ ๋ฆฌ์ฆ ๊ฐ๋ฐ๊ณผ ๊ด๋ จ๋ ์ธ๊ณต์ง๋ฅ(AI)์ ํ์ ๋ถ์ผ์ด๋ค.๋จธ์ ๋ฌ๋: ๋ฐ์ดํฐ ์์ ํต๊ณ์ ๊ด๊ณ๋ฅผ ์ฐพ์๋ด๋ฉฐ ์์ธก์ด๋ ๋ถ๋ฅ๋ฅ๋ฅผ ํ๋ ๋ฐฉ๋ฒ๋ฅ๋ฌ๋: ๋จธ์ ๋ฌ๋์ ํ ๋ถ์ผ๋ก ์ ๊ฒฝ์ธํฌ ๊ตฌ์กฐ๋ฅผ ๋ชจ๋ฐฉํ ์ธ๊ณต ์ ๊ฒฝ๋ง*์ ์ฌ์ฉํจ.* ์ธ๊ณต์ ๊ฒฝ๋ง : ์ธ๊ฐ์ ์ ๊ฒฝ์ธํฌ๋ฅผ ๋ชจ๋ฐฉํ์ฌ ๋ง๋ ๋ง(Networks). ์ธ๊ณต์ ๊ฒฝ๋ง์ ๊ฐ์ฅ ์์ ๋จ์๋ฅผ ํผ์
ํธ๋ก ์ด๋ผ๊ณ ํ๋ค.Gradient Descent๐ก ๊ฒฝ์ฌ ํ๊ฐ๋ฒ(Gradient Descent)์ธ๊ณต์ ๊ฒฝ๋ง ์ค์ฐจํจ์์ ์ต์๊ฐ*์ ์ฐพ์๊ฐ๋ ์ต์ ํ ๊ธฐ๋ฒํ๊ท ๋ฌธ์ ์ ๊ฒฝ์ฐ ๊ฐ์ค์น(weight)๋ฅผ ์ด๋ฆฌ ์ ๋ฆฌ ์์ง์ด๋ฉด์ ์ต์์ MSE๋ฅผ ๋์ถํ๋ ๊ฒ.ํจ์..
240612 Today I Learn๋จธ์ ๋ฌ๋๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ข
๋ฅ์ง๋ ํ์ต (Supervised Learning)๋น์ง๋ ํ์ต (Unservised Learning)๊ฐํ ํ์ต (Reinforcement Learning)๋จธ์ ๋ฌ๋ ๋ชจ๋ธ ์ฑ๋ฅ ํ๊ฐ ์งํ์ ํ๋ Accuracy = (True Positive +True Negative)/TotalAccuracy ๊ฐ ๋ง๋ฅ์ผ ์ ์๋ ์ด์ ์ด๋ค ํ์ฌ์์ 100๋ช
์ค 2๋ช
์ ์ํ์๋ก ์์ธกํ๋ ๋ชจ๋ธ์ ๋ง๋ค๊ณ ์ถ์ ๋, accuracy๋ฅผ ๊ฐ์ฅ ๋๊ฒ ํ ์ ์๋ ๋ฐฉ๋ฒ์ ๋ฌด์์ผ๊น?๋ฐ๋ก 100๋ช
์ ํ์๋ฅผ ๋ชจ๋ ์ํ์๋ผ๊ณ ๋ถ๋ฅํ๋ ๋ชจ๋ธ์ ๋ง๋๋ ๊ฒ์ด๋ค. 100๋ช
์ ํ์๋ฅผ ๋ชจ๋ ์ํ์๋ก ๋ถ๋ฅํ๋ ๋ชจ๋ธ์ ์ ํ๋๋ ๋ฌด๋ ค 98%๊ฐ ๋๋ค. ๊ทธ๋ ๋ค๋ฉด ์ด ํ์ฌ๋ '์ ํฌ ๋ชจ๋ธ์ 98%์ ์ ํ๋๋ก..
240611 Today I Learn๋น์ง๋ ํ์ต ๐ก ๋น์ง๋ํ์ต๋ต์ ์๋ ค์ฃผ์ง ์๊ณ ๊ณต๋ถ์ํค๋ ๋ฐฉ๋ฒ- ์ฐ๊ด๊ท์น- ๊ตฐ์งํ K-Means Clustering๐ก K-Means Clustering์ฃผ์ด์ง ๋ฐ์ดํฐ๋ฅผ k๊ฐ์ ํด๋ฌ์คํฐ๋ก ๋ฌถ๋ ์๊ณ ๋ฆฌ์ฆ์ผ๋ก, ๊ฐ ํด๋ฌ์คํฐ์ ๊ฑฐ๋ฆฌ ์ฐจ์ด์ ๋ถ์ฐ์ ์ต์ํํ๋ ๋ฐฉ์์ผ๋ก ๋์ํ๋ค.์ฅ์ : ์ผ๋ฐ์ ์ด๊ณ ์ ์ฉํ๊ธฐ ์ฌ์๋จ์ ๊ฑฐ๋ฆฌ ๊ธฐ๋ฐ์ผ๋ก ๊ฐ๊น์์ ์ธก์ ํ๊ธฐ ๋๋ฌธ์ ์ฐจ์์ด ๋ง์ ์๋ก ์ ํ๋๊ฐ ๋จ์ด์ง๋ฐ๋ณต ํ์๊ฐ ๋ง์ ์๋ก ์๊ฐ์ด ๋๋ ค์ง๋ช ๊ฐ์ ๊ตฐ์ง(K)์ ์ ์ ํ ์ง ์ฃผ๊ด์ ์ํ๊ท ์ ์ด์ฉํ๊ธฐ ๋๋ฌธ์(์ค์ฌ์ ) ์ด์์น์ ์ทจ์ฝํจ์ข์ ๊ตฐ์งํ๋?์ค๋ฃจ์ฃ ๊ฐ์ด ๋์์๋ก(1์ ๊ฐ๊น์)๊ฐ๋ณ ๊ตฐ์ง์ ํ๊ท ๊ฐ์ ํธ์ฐจ๊ฐ ํฌ์ง ์์ ์๋ก ์ข์ ๊ตฐ์งํ์ด๋ค.๊ตฐ์งํ ์ค์ต - iris๋ฐ์ดํฐ ๋ฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ๋ถ๋ฌ์ค๊ธฐ# ๊ธฐ๋ณธ ๋ผ์ด๋ธ๋ฌ..
240610 Today I Learn์์ฌ๊ฒฐ์ ๋๋ฌด์ ๋๋ค ํฌ๋ ์คํธ๋๋ณด๊ธฐ# ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๋ฐ ๋ฐ์ดํฐ ๋ถ๋ฌ์ค๊ธฐimport pandas as pdimport matplotlib.pyplot as plttitanic = pd.read_csv('TITANIC/train.csv')# ์ ์ฒ๋ฆฌ#Pclass: LabelEncoderfrom sklearn.preprocessing import LabelEncoderle1 = LabelEncoder()titanic['Pclass'] = le1.fit_transform(titanic['Pclass'])#Sex: LabelEncoderle2 = LabelEncoder()titanic['Sex'] = le2.fit_transform(titanic['Sex'])#Age: ๊ฒฐ์ธก์น-> ํ๊ท ..
240611 Today I Learn์ง๋ํ์ต vs. ๋น์ง๋ํ์ต ์ง๋ ํ์ต๋น์ง๋ ํ์ต๋ชฉํ์๋ก์ด ๋ฐ์ดํฐ์ ๊ฒฐ๊ณผ๋ฅผ ์์ธก๋ง์ ์์ ์๋ก์ด ๋ฐ์ดํฐ์ ๋ํ ํต์ฐฐ๋ ฅ์ ์ป๋ ๊ฒ์ฌ์ฉ ๋ฐ์ดํฐ๋ ์ด๋ธ์ด ์ง์ ๋ ๋ฐ์ดํฐ์ธํธ๋ ์ด๋ธ์ด ์ง์ ๋์ง ์์ ๋ฐ์ดํฐ์ธํธ์ ํ์ฑ๋น๊ต์ ๋์→ ๋จ, ๋ฐ์ดํฐ์ ์ ์ ํ๊ฒ ๋ ์ด๋ธ์ ์ง์ ํ๊ธฐ ์ํด์๋ ๋ฐ์ดํฐ๋ถ์๊ฐ์ ์ ์ ํ ์ฃผ๊ด์ด ํ์.๋น๊ต์ ๋ถ์ ํ๋ณต์ก์ฑ๋น๊ต์ ๋ฎ์๋น๊ต์ ๋์→ ๋๊ท๋ชจ ํ๋ จ ์ธํธ, ํต๊ณ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๊ฐ ํ์ํจ.ํ์ฉ ๋ถ์ผ๊ฐ์ ๋ถ์, ์ผ๊ธฐ ์๋ณด ๋ฐ ๊ฐ๊ฒฉ ์์ธก์ด์ ๊ฐ์ง, ์ถ์ฒ ์์ง, ๊ณ ๊ฐ ํ๋ฅด์๋ ๋ฐ ์๋ฃ ์์์ฌ์ฉ๋๋ ๊ธฐ๋ฒ์ ํ ํ๊ท(Linear Regression)๋ก์ง์คํฑ ํ๊ท(Logistic Regression)๋์ด๋ธ ๋ฒ ์ด์ฆ(Naive Bayes)K-์ต๊ทผ์ ์ด์(k-Nearest Neighbors)์..
240610 Today I Learnํ๊ท๋ถ์์ด๋?๐ก ํ๊ท๋ถ์๋
๋ฆฝ๋ณ์(x)๋ก ์ข
์๋ณ์(y)๋ฅผ ์์ธกํ๋ ๋ถ์๊ธฐ๋ฒ์ผ๋ก ์ถ์ธ์ *์ ์ฐพ๋๊ฒ์ด ๋ชฉ์ ์ด๋ค. ๊ฐ์ง๊ณ ์์ง ์์ ๋ฐ์ดํฐ์ ๋ํ ์์ธก์ ํ๊ณ ์ถ์ ๋ ์ฌ์ฉํ๋ค. *์ถ์ธ์ y = a+bxํ๊ท๋ถ์์ ๋จ๊ณ๋
๋ฆฝ๋ณ์(x), ์ข
์๋ณ์(y) ์ค์ ๋ฐ ๊ฐ์ค(๊ท๋ฌด vs. ๋๋ฆฝ)์ค์ x(๊ฒ์์๊ฐ, ๋
๋ฆฝ๋ณ์), y(์ ๊ธฐ์ธ, ์ข
์๋ณ์)๋๋ฆฝ๊ฐ์ค : ๊ฒ์์๊ฐ์ ์ ๊ธฐ์ธ์ ๊ด๋ จ์ด ์์ ๊ฒ์ด๋ค.→ ๊ท๋ฌด๊ฐ์ค : ๊ฒ์์๊ฐ์ ์ ๊ธฐ์ธ์ ๊ด๋ จ์ด ์์ ๊ฒ์ด๋ค.๋ฐ์ดํฐ ๊ฒฝํฅ์ฑ ํ์ธ → ์ฐ์ ๋๋ฅผ ๊ฐ๋จํ๊ฒ ๊ทธ๋ ค๋ณด๊ธฐ๋ฐ์ดํฐ๊ฐ ์ด๋ป๊ฒ ๋ถํฌํด์๋์ง ํ์ธํ๊ธฐ.์ด๋์ ๋ฐ์ดํฐ๋ค์ด ๋ง์ด ๋ถํฌํด ์๋์ง ํ์ธํ๊ธฐ.์ ํฉ์ฑ ๊ฒ์ฆ & ๊ฒฐ๊ณผ ํด์ํ๊ท๋ชจ๋ธ(ํ๊ท์)์ด ์ผ๋ง๋ ์ค๋ช
๋ ฅ์ ๊ฐ๋์ง? - ์ผ๋ง๋ ์ ํํ์ง?ํ๊ท๋ชจ๋ธ์ด ํต๊ณ์ ์ผ๋ก ์ ..