전체 글

실전 프로젝트 : What's Next?EDA상관관계 히트맵 그리기더보기# 상관관계 분석을 위한 라벨 인코딩from sklearn.preprocessing import LabelEncoderle1 = LabelEncoder()le2 = LabelEncoder()le3= LabelEncoder()le4= LabelEncoder()df5['adult_le'] = le1.fit_transform(df5['adult']) #adultdf5['original_language_le'] = le2.fit_transform(df5['original_language']) #original_languagedf5['main_genre_le'] = le3.fit_transform(df5['main_genre']) #main ..
실전 프로젝트 : What's Next?컬럼 정보분석에 사용될 컬럼vote_average, vote_count, release_date, revenue, runtime, adult, budget, original_language, poster_path, genres, production_companies, production_countries, spoken_languages, keywordsid(기본키) - 영화 제목이 같지만, 고유한 id가 부여되어 영화를 구분할 수 있게 해줌.status - 데이터 전처리 과정에서 '개봉(released)' 상태의 영화를 골라내기 위해 사용 후 삭제데이터를 어떻게 가공해 활용할지?✅ 코로나 전후 비교 → 시간선 설정2023 9월 이후 데이터가 이전과 비교해 많이 적음..
실전 프로젝트 : What's Next? 주제선정 배경주제 선정 과정에서, 태블로에 조금 더 집중하고자 '과거 마블 영화 흥행 분석을 통한 신규 마블 컨텐츠 기획'을 주제로 프로젝트를 진행하려고 했다. 그러나, 기술적 한계로 웹크롤링을 활용해 데이터를 수집할 수 없었기에 kaggle에 공유된 'TMDB' 데이터를 선정해 프로젝트를 진행하게 되었다. 프로젝트 기획개요🌈 ‘쿠팡플레이’의 데이터 분석가인 저희는 8월에 새롭게 런칭할 영화를 알고 싶다는 사업팀의 요청을 받았습니다.TMDB 데이터 시각화를 통해 Tableau 대시보드 제작 능력을 기르는 것을 목표로 합니다.TMDB 데이터 셋을 사용하여 흥행 작품, 국가별 선호도, ROI 등을 분석하고 다음 신규 컨텐츠 제작 시 참고할 수 있는 대시보드를 제공하..
240702 Today I Learn워크 시트에 여러 측정값 활용하기측정값 직렬 배치측정값을 단순하게 행에 여러 개 추가하는 방법 각각의 측정값에 다른 차트 형식과 마크 서식을 적용할 수 있음.이중축 활용이중축 차트는 다른 유형의 측정값을 하나의 차트로 사용하기 위해서 사용된다.활용 방법 : 바+꺾은선 그래프, 도넛 차트추가적인 축 활용차원 머리글 활용별칭 편집: 데이터에 있는 명칭 외에 다른 이름을 부여하고 싶을 때 사용→ 측정값 이름이 너무 길면 별칭 편집으로 수정할 수 있음.레이블 회전은 주로 공간 때문에 문자가 세로로 표시될 때 가로로 전환하기 위해 사용측정값 축 활용측정값은 축 편집을 통해 범위를 지정할 수 있음→ 측정값 안에 묶여 있을 때 축을 동일한 범위로 만들거나 독립적인 축 범위를 부여할..
240702 Today I Learn문제 상황📌 주요 지표(수익, 매출, 수익률, 주문수, 고객수)의 MoM을 나타내는 차트를 그려라.우선 우리가 생각할 수 있는 가장 간단한 방법인, 모든 지표를 측정값으로 각각 추가해 지표의 개수만큼의 차트를 하나의 그래프에 나타내는 방법이 있다. 이 방법으로 그린 차트는 아래와 같다.워크시트에서만 작업을 해봐도 이 방법은 상당히 불편한 방법임을 알 수 있다. 우선 주요 지표를 모두 측정값으로 추가해 퀵 테이블 계산을 해주고 색상값 역시 서식을 따로 지정해줘야 하기 때문이다. 이 차트를 대시보드에 넣어 보면, 이 방법이 얼마나 비효율적인지 알 수 있다. 위의 시트를 대시보드에 표현하면 다음과 같이 나타나게 된다.보통 대시보드의 경우 의사결정자들이나 실무진들이 실적을 ..
240702 Today I Learn문제 상황📌 사용자가 입력하는 n 값에 따라 평균 수익이 높은 상위 n개의 하위범주의 평균 수익을 그래프로 그릴 수 있도록 하라.✅ 매개변수를 활용하시오.✅ 대시보드에 적용하시오.0. 기본 그래프 그리기우선 필터가 적용될 그래프를 먼저 그려준다. 하위 범주에 따라 평균 수익을 나타내는 막대 그래프를 그리면 필터를 적용하기 위한 준비가 끝난다. (평균 수익을 더 가시적으로 확인하기 위해 측정값을 레이블에 넣어주었다.)Top N 필터 만들기1. 매개변수 만들기먼저 N값을 입력받을 매개변수를 만들어야 한다. 이 경우, 'Top N 필터'라는 이름의 매개변수를 만들도록 하겠다. 어떤 값을 입력받을 것인가에 따라 '허용 가능한 값'을 조정할 수 있는데 이번에는 '전체'를 선택..
ny:D
n.archive