240521 Today I LearnWindow Function💡 Window Function행과 행의 관계를 정의하기 위해 제공되는 함수로 모든 컬럼을 잃고 싶지 않을 때 사용한다.# 윈도우 함수 기본문법 SELECT WINDOW_FUNCTION () OVER([PARTITION BY 컬럼] [ORDER BY 컬럼])FROM 테이블명 종류함수순위RANK, DENSE_RANK, ROW_NUMBER집계SUM, MAX, MIN, AVG, COUNT순서FIRST_VALUE, LAST_VALUE, LAG, LEAD비율RATIO_TO_REPROT, CUME_DIST순위💡 ROW_NUMBER' 줄세우기를 한다.' → 줄세우기를 한다고 했을 때 중복 순위 발생 불가함.어떻게든 순위를 지정함.ROW_NUMBE..
전체 글
240527 Today I Learn한글 깨짐현상 해결하기sns.lineplot(data=flights, x = 'year', y = 'passengers')plt.title('연도별 승객수')plt.title을 안에 한글로 된 텍스트를 넣으면 위와 같이 한글 깨짐 현상이 발생한다. 이 문제는 기본으로 사용중인 시스템 글꼴이 한글을 지원하지 않기 때문에 발생한다. 이를 해결하기 위해서는 한글 폰트를 별도로 지정해줘야한다.적용 가능한 한글 폰트 찾기 및 적용하기맥에서는 `/Users/user_name/Library/Fonts` 폴더에 폰트 파일이 저장되어있다. 아니면 '서체관리자'에들어가서 마음에 드는 한글 폰트를 선택한 뒤 'Finder에서 보기'를 선택해도된다. 보통 ttf 파일을 지원한다고 하는데, ..
👌 FACTS[5/20 - 5/24 진도 정리]기초 프로젝트 끝내기SQLD 시험SQL Challenge Session 1, 2회차💓 FEELINGS몰아치듯 할일의 홍수 속에서 몸은 안따라주고.. 할일은 많아서 좀 많이 힘들었지만, 그래도 내가 해냈다는 사실자체가 굉장히 뿌듯하다. 또한 이번 프로젝트를 진행하면서 내 스스로 어떤 부분이 부족한지 아쉬운 점들을 많이 깨닫게 되었다. 💡 FINDINGS프로젝트를 하는 과정에서 다양한 그래프들을 그렸는데, 그래프를 더 예쁘게 그릴수 있는 툴을 사용해보았다. 아직 정리는 못했지만, 곧 다양한 그래프 꾸미기..(?) 툴들을 다루는 총정리 포스팅을 통해 정리해둘 예정이다.! 🔮 FUTURE이번 프로젝트에서 누적 막대그래프를 작성하는 방법을 결국 못 익혀서 사용..
기초 프로젝트 : 은행 고객데이터를 이용한 서비스 분석 기초 프로젝트 : 은행 고객데이터를 이용한 서비스 분석(5)기초 프로젝트 : 은행 고객데이터를 이용한 서비스 분석📊 시각화 - 소득이 높은 고객(VIP)고객을 잡아라!3. VIP 고객들의 예치 현황 파악VIP 고객들은 투자를 많이 하는지 아니면 예치를 하는archivenyc.tistory.com🎙️ 최종 발표 자료 기초프로젝트디자인 전문가가 아니어도 무료 템플릿으로 손쉽게 원하는 디자인을 할 수 있어요.www.miricanvas.com 💖 발표 후 받은 피드백16%의 데이터 손실이 발생했다는 것은 조금 크다고 생각, EDA 과정에서 미숙함이 있었다. 하지만 각각 컬럼에 대해 많이 이해하려고 노력한것 같아보였음가장 맘에 들었던 부분은 30,50..
기초 프로젝트 : 은행 고객데이터를 이용한 서비스 분석📊 시각화 - 소득이 높은 고객(VIP)고객을 잡아라!3. VIP 고객들의 예치 현황 파악VIP 고객들은 투자를 많이 하는지 아니면 예치를 하는 편인지 알아보자.✅ VIP 고객들은 소득이 많으면 투자를 많이 하는가?# 사이즈 지정plt.figure(figsize=(16,9))# 산점도 그리기sns.scatterplot(data = stat, x='Monthly_Income', y='Amount_invested_monthly', hue = 'age_group', palette = green_palette2, alpha= 0.5)# 제목 붙이기plt.title('Regression Analysis of Monthly Income - Amount of M..
기초 프로젝트 : 은행 고객데이터를 이용한 서비스 분석🗂️ 데이터 정규화 & 표준화Age_group을 생성고객들의 Age를 10대, 20대, 30대 등의 범주로 그룹화해 ‘age_group’ 컬럼을 추가적으로 생성했다.bank_numeric['age_group']= [int(i//10)*10 for i in bank_numeric['Age']] Loan Type을 분리해 더미 변수로 만들기Type_of_Loan 컬럼의 경우 Loan의 종류별로 구분된 것이 아니라 컴마를 통해 하나의 값으로 연결되어있는데, 이렇게 되면 다음과 같은 문제가 발생하게된다.✅ 고객마다 어떤 종류의 대출을 받았는지 확인하기 어려움✅ 대출 종류는 같아도 순서가 다르기 때문에 하나의 컬럼으로 합치기 어려움따라서 데이터에서 조금더 쉽..