240717 Today I Learnํฌ๋กค๋ง๊ณผ ์คํฌ๋ํํฌ๋กค๋ง vs. ์คํฌ๋ํ์น ํฌ๋กค๋ง: ์น์์ ์กด์ฌํ๋ ๋ชจ๋ ์น ํ์ด์ง๋ฅผ ๋ฐฉ๋ฌธํ์ฌ ๋ฐ์ดํฐ๋ฅผ ์์งํ๋ ๋ฐฉ๋ฒ. ํฌ๋กค๋ฌ๋ ์ธํฐ๋ท ์์ ๋ชจ๋ ํ์ด์ง๋ฅผ ๋ฐฉ๋ฌธํ๋ฉฐ, ๊ฐ ํ์ด์ง์ ๋งํฌ๋ฅผ ๋ฐ๋ผ๊ฐ๋ฉด์ ์๋์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์์งํจ.์น ์คํฌ๋ํ: ํน์ ์น ์ฌ์ดํธ๋ ํ์ด์ง์์ ํ์ํ ๋ฐ์ดํฐ๋ฅผ ์๋์ผ๋ก ์ถ์ถํด ๋ด๋ ๊ฒ ์น ํฌ๋กค๋ง์คํฌ๋ํ๊ณตํต์ ์ํ๋ ๋ฐ์ดํฐ๋ฅผ ์์งํ ์ ์๋ค.๊ธฐ์ ์ ์ผ๋ก ํ์ด์ฌ์ผ๋ก ํจ๊ป ์ฌ์ฉ๋๋ ๊ฒฝ์ฐ๊ฐ ๋ง์. (์น ํฌ๋กค๋ง์ ํตํ ์น์ ๊ทผ → ์คํฌ๋ํ์ ํตํ ํน์ ๋ฐ์ดํฐ ์ถ์ถ)์ค๋ณต์ ๊ฑฐ์ค๋ณต์ ๊ฑฐ ํ์→ ๋์ผํ ์ฝํ
์ธ ๊ฐ ์ฌ๋ฌ ํ์ด์ง์ ์
๋ก๋ ๋ ๊ฒ์ ์ธ์ํ์ง ๋ชปํจ.๋ฐ๋์ ํ์ํ ๊ฒ์ ์๋→ ํน์ ๋ฐ์ดํฐ๋ฅผ ์ถ์ถํ๋ ๊ฒ์ฐจ์ด์ ์น์ฌ์ดํธ์ ๋ํ ์ ๋ณด๋ฅผ ์์ธํํ๊ณ ์ ์ฅํ๋ ๋ฐ ์ฌ์ฉ๊ฒ์ ์์ง ๋ฐ..
๐ Data Analysis
240716 Today I Learn API ํต์ ์ ๊ฐ๋
๊ฐ๋
API(Application Programming Interface)์ํํธ์จ์ด ๊ตฌ์ฑ ์์๊ฐ ์๋ก ํต์ ํ ์ ์๊ฒ ํ๋ ๋ฐฉ์(๋ฉ์ปค๋์ฆ).→ ํ๋ก๊ทธ๋จ๊ณผ ํ๋ก๊ทธ๋จ์ ์ฐ๊ฒฐ์์ผ์ฃผ๋ ํต์ ์ ๋ฐฉ๋ฒ ๊ฐ๋จํ ํธ์ถ๊ตฌ๋ฌธ์ ํตํด ๋ฐ์ดํฐ๋ฅผ ์ก์ ๋ฐ์ ์ ์์.์คํ API ๋, ๊ธฐ์
๋ด ๋ฐ์ดํฐ๋ฅผ ์ผ๋ฐ ์ฌ์ฉ์์๊ฒ ๊ณต๊ฐํ๋ ๊ฒ์ญํ ๋ฐ ํน์ง๊ถํ๊ด๋ฆฌ๋ง์ ๋ฐ์ดํฐ๊ฐ ์ ์ฌ(์ ์ฅ)๋๋ DB ์๋ ๋ชจ๋ ์ฌ๋๋ค์ด ์ด DB์ ์ ๊ทผํ๋ฉด ๋ณด์์์ ์ด์๊ฐ ๋ฐ์ํ ์ ์์.API ๋ ์ด๋ฅผ ๋ฐฉ์งํ๊ธฐ ์ํด ์ ๊ทผ์ด ํ์ฉ๋ ๋ก์ปฌ์๊ฒ๋ง ๊ถํ์ ๋ถ์ฌํ๋ ‘์ค๊ฐ๊ด๋ฆฌ์’ ์ญํ ์ ์ํํ๋ก๊ทธ๋จ ๊ฐ (์ํํ) ํต์ ์ง์API ๋ ์์นซ ์ด๋ ค์ด ๋ฐฉ์์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์์งํ ์ ์๋ ๋ถ๋ถ์ ํค๊ฐ์ ํตํด ๊ฐํธํ ํต์ ์ ์ง์ํด๋น ํค..
์ค์ ํ๋ก์ ํธ : What's Next?๐ ๋ฐํ ํ ๋ฐ์ ํผ๋๋ฐฑ๋์๋ณด๋ ํ์ฉ ๋ฐฉ์์ ๋ํ ๋ฐ๋ชจ๊ฐ ์ ๋ง๋ค์ด ์ง ๊ฒ ๊ฐ๋ค.๋ฐฐ๊ฒฝ์ ๊ฐ์ด๋ฐ ๊ทธ๋ผ๋ฐ์ด์
๋๋ฌธ์ ํ์ ์ ์ด ์ ๋ณด์ด์ง ์์์ ์์ฌ์ ๋ค.๋ฐ์ดํฐ ๋ถ์์ ์์ด ๊ต์ฅํ ๋ํ
์ผํ๋ค. ํนํ ๊ฒฐ์ธก์น ์ ๊ฑฐ ๋ถ๋ถ์์ ๋จ์ํ๊ฒ ์ฒ๋ฆฌํ์ง ์๊ณ ํ๋์ฉ ๋ฐ์ ธ๊ฐ๋ฉด์ ์ด๋ค ๊ฒ๋ค์ ์ ๊ฑฐํด์ผ ํ ์ง, ์ด๋ป๊ฒ ์ ๊ฑฐํ ์ง ๊ณ ๋ฏผํ ๊ฒ์ด ์ ๋ณด์๋ค. ๋ฌผ๋ก ๋๋ฌด ๋นจ๋ฆฌ ์ง๋๊ฐ์ ์์ธํ ์ดํด๋ณด์ง ๋ชปํ์. (์ด์ฉ์ ์๋๊ฑด ์ธ์ )๊ทธ ๋ฐ์๋ ๋ค์ํ ์๊ด๊ด๊ณ ๋ถ์๊ณผ ์ ์์ฌ, ์ธ์ด ๋ฑ ๊ตฌ๋ถ์ ๋๋ ์ EDA ์งํํ ๊ฒ์ด ์ข์๋ค. ๋ค๋ง, ๊ทธ๋ํ๋ฅผ ๋ณด์ฌ์ค ๋ ๊ธ์๊ฐ ์์์ ์ ๋ณด์ด์ง ์๋ ๊ทธ๋ํ๋ค์ด ์์ด์ ์์ฌ์ ๋ค.์ ๋ฐ์ ์ธ ๋ถ์์ ๋ก์ง๊ณผ ๋ถ์์ ์์ด์ ๋ํ
์ผํ๊ฒ ์ ๊ฒฝ์ด ๊ฒ๋ค์ ์ ํ๋ค๊ณ ๋ดค๋ค.ํฐ ๋ณ์์ธ ์ฝ๋ก..
์ค์ ํ๋ก์ ํธ : What's Next?Figma ์ด์ฉ ๋ฐฐ๊ฒฝ ๋ง๋ค๊ธฐ๋ฉ์ธ ๋์๋ณด๋Scatter Plot ๊ทธ๋ฆฌ๊ธฐ1. ํฌํ ์(x์ถ) ๋๋น ์์ต(y์ถ) ๋ธ๋ก๋ฒ์คํฐ ์ํ(๊ธ๋ก๋ฒ ๋งค์ถ 4์ต ๋ฌ๋ฌ ์ด์)๋งค์ถ์ด 4์ต๋ฌ๋ฌ ์ด์์ธ ๋ธ๋ก๋ฒ์คํฐ ์ํ๋ง ํํฐ๋งy์ถ profit ์ Revenue(๋งค์ถ) - Budget(์์ฐ)ํ์ ๋์ ๋ฐ๋ผ ์์ ์ง์ `FLOOR([Vote Average])`๋ฅผ ์ด์ฉ 'ํ์ '์ด๋ผ๋ ๊ณ์ฐ๋ ํ๋๋ฅผ ์๋กญ๊ฒ ์์ฑ์ด๋ฅผ ์์์ ๋ฃ์ด ํ์ ๋์ ๋ฐ๋ผ ์์์ด ์ง์ ๋๋๋ก ํจ.2. ํฌํ์(x์ถ) ๋๋น ์์ต(y์ถ) ๋งค์ถ๊ณผ ์์ฐ์ด ๋ชจ๋ 0๋ณด๋ค ํฐ ์์
์ํ๋ง ํํฐ๋งBlockbuster(ํํฌ) vs. General(ํ์) : ์งํฉ๊ธฐ๋ฅ์ ํ์ฉ ์ ๊ตฌ๋ถ. ๋ธ๋ก๋ฒ์คํฐ ์ํ๋ค์ ํน์ง์ด ๋ฌด์์ธ์ง ํ์
ํ ์ ์๋๋ก ํจ.๊ณ ํ์ (โ
, 7..
์ค์ ํ๋ก์ ํธ : What's Next?EDA์๊ด๊ด๊ณ ํํธ๋งต ๊ทธ๋ฆฌ๊ธฐ๋๋ณด๊ธฐ# ์๊ด๊ด๊ณ ๋ถ์์ ์ํ ๋ผ๋ฒจ ์ธ์ฝ๋ฉfrom sklearn.preprocessing import LabelEncoderle1 = LabelEncoder()le2 = LabelEncoder()le3= LabelEncoder()le4= LabelEncoder()df5['adult_le'] = le1.fit_transform(df5['adult']) #adultdf5['original_language_le'] = le2.fit_transform(df5['original_language']) #original_languagedf5['main_genre_le'] = le3.fit_transform(df5['main_genre']) #main ..
์ค์ ํ๋ก์ ํธ : What's Next?์ปฌ๋ผ ์ ๋ณด๋ถ์์ ์ฌ์ฉ๋ ์ปฌ๋ผvote_average, vote_count, release_date, revenue, runtime, adult, budget, original_language, poster_path, genres, production_companies, production_countries, spoken_languages, keywordsid(๊ธฐ๋ณธํค) - ์ํ ์ ๋ชฉ์ด ๊ฐ์ง๋ง, ๊ณ ์ ํ id๊ฐ ๋ถ์ฌ๋์ด ์ํ๋ฅผ ๊ตฌ๋ถํ ์ ์๊ฒ ํด์ค.status - ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๊ณผ์ ์์ '๊ฐ๋ด(released)' ์ํ์ ์ํ๋ฅผ ๊ณจ๋ผ๋ด๊ธฐ ์ํด ์ฌ์ฉ ํ ์ญ์ ๋ฐ์ดํฐ๋ฅผ ์ด๋ป๊ฒ ๊ฐ๊ณตํด ํ์ฉํ ์ง?โ
์ฝ๋ก๋ ์ ํ ๋น๊ต → ์๊ฐ์ ์ค์ 2023 9์ ์ดํ ๋ฐ์ดํฐ๊ฐ ์ด์ ๊ณผ ๋น๊ตํด ๋ง์ด ์ ์..