πŸ“Š Data Analysis/🎯 Project

μ‹€μ „ ν”„λ‘œμ νŠΈ : What's Next?πŸ’– λ°œν‘œ ν›„ λ°›μ€ ν”Όλ“œλ°±λŒ€μ‹œλ³΄λ“œ ν™œμš© λ°©μ•ˆμ— λŒ€ν•œ 데λͺ¨κ°€ 잘 λ§Œλ“€μ–΄ 진 것 κ°™λ‹€.배경의 κ°€μš΄λ° κ·ΈλΌλ°μ΄μ…˜ λ•Œλ¬Έμ— νšŒμƒ‰ 점이 잘 보이지 μ•Šμ•„μ„œ 아쉬웠닀.데이터 뢄석에 μžˆμ–΄ ꡉμž₯히 λ””ν…ŒμΌν–ˆλ‹€. 특히 결츑치 제거 λΆ€λΆ„μ—μ„œ λ‹¨μˆœν•˜κ²Œ μ²˜λ¦¬ν•˜μ§€ μ•Šκ³  ν•˜λ‚˜μ”© λ”°μ Έκ°€λ©΄μ„œ μ–΄λ–€ 것듀을 μ œκ±°ν•΄μ•Ό 할지, μ–΄λ–»κ²Œ μ œκ±°ν• μ§€ κ³ λ―Όν•œ 것이 잘 λ³΄μ˜€λ‹€. λ¬Όλ‘  λ„ˆλ¬΄ 빨리 μ§€λ‚˜κ°€μ„œ μžμ„Ένžˆ μ‚΄νŽ΄λ³΄μ§€ λͺ»ν–ˆμŒ. (μ–΄μ©”μˆ˜ μ—†λŠ”κ±΄ 인정)κ·Έ 밖에도 λ‹€μ–‘ν•œ 상관관계 뢄석과 μ œμž‘μ‚¬, μ–Έμ–΄ λ“± ꡬ뢄을 λ‚˜λˆ μ„œ EDA μ§„ν–‰ν•œ 것이 μ’‹μ•˜λ‹€. λ‹€λ§Œ, κ·Έλž˜ν”„λ₯Ό 보여쀄 λ•Œ κΈ€μžκ°€ μž‘μ•„μ„œ 잘 보이지 μ•ŠλŠ” κ·Έλž˜ν”„λ“€μ΄ μžˆμ–΄μ„œ 아쉬웠닀.μ „λ°˜μ μΈ λΆ„μ„μ˜ 둜직과 뢄석에 μžˆμ–΄μ„œ λ””ν…ŒμΌν•˜κ²Œ μ‹ κ²½μ“΄ 것듀은 잘 ν–ˆλ‹€κ³  λ΄€λ‹€.큰 λ³€μˆ˜μΈ μ½”λ‘œ..
μ‹€μ „ ν”„λ‘œμ νŠΈ : What's Next?Figma 이용 λ°°κ²½ λ§Œλ“€κΈ°λ©”μΈ λŒ€μ‹œλ³΄λ“œScatter Plot 그리기1. νˆ¬ν‘œ 수(xμΆ•) λŒ€λΉ„ 수읡(yμΆ•) λΈ”λ‘λ²„μŠ€ν„° μ˜ν™”(κΈ€λ‘œλ²Œ 맀좜 4μ–΅ λ‹¬λŸ¬ 이상)맀좜이 4μ–΅λ‹¬λŸ¬ 이상인 λΈ”λ‘λ²„μŠ€ν„° μ˜ν™”λ§Œ 필터링yμΆ• profit 은 Revenue(맀좜) - Budget(μ˜ˆμ‚°)ν‰μ λŒ€μ— 따라 색상 지정`FLOOR([Vote Average])`λ₯Ό 이용 '평점'μ΄λΌλŠ” κ³„μ‚°λœ ν•„λ“œλ₯Ό μƒˆλ‘­κ²Œ 생성이λ₯Ό 색상에 λ„£μ–΄ ν‰μ λŒ€μ— 따라 색상이 μ§€μ •λ˜λ„λ‘ 함.2. νˆ¬ν‘œμˆ˜(xμΆ•) λŒ€λΉ„ 수읡(yμΆ•) 맀좜과 μ˜ˆμ‚°μ΄ λͺ¨λ‘ 0보닀 큰 μƒμ—…μ˜ν™”λ§Œ 필터링Blockbuster(핑크) vs. General(νšŒμƒ‰) : 집합기λŠ₯을 ν™œμš© 색 ꡬ뢄. λΈ”λ‘λ²„μŠ€ν„° μ˜ν™”λ“€μ˜ νŠΉμ§•μ΄ 무엇인지 νŒŒμ•…ν•  수 μžˆλ„λ‘ 함.고평점(β˜…, 7..
μ‹€μ „ ν”„λ‘œμ νŠΈ : What's Next?EDA상관관계 히트맡 그리기더보기# 상관관계 뢄석을 μœ„ν•œ 라벨 인코딩from sklearn.preprocessing import LabelEncoderle1 = LabelEncoder()le2 = LabelEncoder()le3= LabelEncoder()le4= LabelEncoder()df5['adult_le'] = le1.fit_transform(df5['adult']) #adultdf5['original_language_le'] = le2.fit_transform(df5['original_language']) #original_languagedf5['main_genre_le'] = le3.fit_transform(df5['main_genre']) #main ..
μ‹€μ „ ν”„λ‘œμ νŠΈ : What's Next?컬럼 정보뢄석에 μ‚¬μš©λ  컬럼vote_average, vote_count, release_date, revenue, runtime, adult, budget, original_language, poster_path, genres, production_companies, production_countries, spoken_languages, keywordsid(κΈ°λ³Έν‚€) - μ˜ν™” 제λͺ©μ΄ κ°™μ§€λ§Œ, κ³ μœ ν•œ idκ°€ λΆ€μ—¬λ˜μ–΄ μ˜ν™”λ₯Ό ꡬ뢄할 수 있게 ν•΄μ€Œ.status - 데이터 μ „μ²˜λ¦¬ κ³Όμ •μ—μ„œ 'κ°œλ΄‰(released)' μƒνƒœμ˜ μ˜ν™”λ₯Ό 골라내기 μœ„ν•΄ μ‚¬μš© ν›„ μ‚­μ œλ°μ΄ν„°λ₯Ό μ–΄λ–»κ²Œ 가곡해 ν™œμš©ν• μ§€?βœ… μ½”λ‘œλ‚˜ μ „ν›„ 비ꡐ → μ‹œκ°„μ„  μ„€μ •2023 9μ›” 이후 데이터가 이전과 비ꡐ해 많이 적음..
μ‹€μ „ ν”„λ‘œμ νŠΈ : What's Next? μ£Όμ œμ„ μ • 배경주제 μ„ μ • κ³Όμ •μ—μ„œ, νƒœλΈ”λ‘œμ— 쑰금 더 μ§‘μ€‘ν•˜κ³ μž 'κ³Όκ±° λ§ˆλΈ” μ˜ν™” ν₯ν–‰ 뢄석을 ν†΅ν•œ μ‹ κ·œ λ§ˆλΈ” 컨텐츠 기획'을 주제둜 ν”„λ‘œμ νŠΈλ₯Ό μ§„ν–‰ν•˜λ €κ³  ν–ˆλ‹€. κ·ΈλŸ¬λ‚˜, 기술적 ν•œκ³„λ‘œ 웹크둀링을 ν™œμš©ν•΄ 데이터λ₯Ό μˆ˜μ§‘ν•  수 μ—†μ—ˆκΈ°μ— kaggle에 곡유된 'TMDB' 데이터λ₯Ό μ„ μ •ν•΄ ν”„λ‘œμ νŠΈλ₯Ό μ§„ν–‰ν•˜κ²Œ λ˜μ—ˆλ‹€. ν”„λ‘œμ νŠΈ κΈ°νšκ°œμš”πŸŒˆ ‘μΏ νŒ‘ν”Œλ ˆμ΄’의 데이터 뢄석가인 μ €ν¬λŠ” 8월에 μƒˆλ‘­κ²Œ λŸ°μΉ­ν•  μ˜ν™”λ₯Ό μ•Œκ³  μ‹Άλ‹€λŠ” μ‚¬μ—…νŒ€μ˜ μš”μ²­μ„ λ°›μ•˜μŠ΅λ‹ˆλ‹€.TMDB 데이터 μ‹œκ°ν™”λ₯Ό 톡해 Tableau λŒ€μ‹œλ³΄λ“œ μ œμž‘ λŠ₯λ ₯을 κΈ°λ₯΄λŠ” 것을 λͺ©ν‘œλ‘œ ν•©λ‹ˆλ‹€.TMDB 데이터 셋을 μ‚¬μš©ν•˜μ—¬ ν₯ν–‰ μž‘ν’ˆ, ꡭ가별 μ„ ν˜Έλ„, ROI 등을 λΆ„μ„ν•˜κ³  λ‹€μŒ μ‹ κ·œ 컨텐츠 μ œμž‘ μ‹œ μ°Έκ³ ν•  수 μžˆλŠ” λŒ€μ‹œλ³΄λ“œλ₯Ό μ œκ³΅ν•˜..
μ‹¬ν™”ν”„λ‘œμ νŠΈ : νšŒκ·€λΆ„μ„μ„ ν™œμš©ν•œ μ›”λ§ˆνŠΈ μ£Όκ°„ νŒλ§€λŸ‰ μ˜ˆμΈ‘πŸ’– λ°œν‘œ ν›„ λ°›μ€ ν”Όλ“œλ°±μ’‹μ•˜λ˜ λΆ€λΆ„νŒ€μ›λ³„λ‘œ 역할이 λͺ…ν™•ν•΄ μ’‹μ•˜λ‹€.ν…Œμ΄λΈ”λ³„λ‘œ 데이터 νƒ€μž…μ„ λͺ…μ‹œν•΄ μ€€ 점과, λΉ„κ³  λΆ€λΆ„μ—μ„œ λ§ˆν¬λ‹€μš΄ μ»¬λŸΌμ— κ²°μΈ‘μΉ˜κ°€ μžˆλ‹€λŠ” 점을 λͺ…μ‹œν•œ 점이 μ’‹μ•˜λ‹€.라벨인코딩에 λŒ€ν•œ λͺ…ν™•ν•œκΈ°μ€€μ΄ μžˆμ–΄ μ’‹μ•˜λ‹€.μ‹œκ°ν™”μ‹œ μ—°λ„λ³„λ‘œ λ‚˜λˆŒ 수 μžˆλŠ” ꡬ뢄선을 ν‘œκΈ°ν•΄μ€˜μ„œ μ’‹μ•˜λ‹€.μ„ ν˜•νšŒκ·€ λͺ¨λΈμ„ μ„ νƒν•˜μ§€ μ•Šμ€ 이유λ₯Ό 숫자둜 증λͺ…ν•΄μ„œ μ’‹μ•˜μŒ.μΆ”κ°€λ‘œ λ³€μˆ˜λ₯Ό 넣을 생각을 잘 ν•˜μ§€ μ•Šκ²Œ λ˜λŠ”λ°, κ°€μ„€1μ—μ„œ μΆ”κ°€μ»¬λŸΌ week μ„ μ •ν•œ 것 μ’‹μ•˜μŒ.λ˜ν•œ 가섀을 μ‘°ν•©ν•΄μ„œ μ„±λŠ₯ κ°œμ„ μ„ ν•  생각을 ν•œκ²ƒμ΄ μ’‹μ•˜λ‹€. λͺ¨λΈ μ•ˆμ •μ„±μ— λŒ€ν•΄ κ³ λ €ν•œ 것도 μ’‹μ•˜λ‹€. -> μ„±λŠ₯에 λ„ˆλ¬΄ μ΄ˆμ μ— λ§žμΆ°μ§€λŠ” κ²½μš°κ°€ μžˆλŠ”λ° λͺ¨λΈ μ•ˆμ •μ„± ~μ „μ²΄μ μœΌλ‘œ  연결성이 μžˆμ–΄μ„œ μ’‹μ•˜λ‹€.μ•„μ‰¬μš΄ λΆ€λΆ„λ§ˆν¬..
ny:D
'πŸ“Š Data Analysis/🎯 Project' μΉ΄ν…Œκ³ λ¦¬μ˜ κΈ€ λͺ©λ‘