전체 글

기초 프로젝트 : 은행 고객데이터를 이용한 서비스 분석  기초 프로젝트 : 은행 고객데이터를 이용한 서비스 분석 (2)기초 프로젝트 : 은행 고객데이터를 이용한 서비스 분석  기초 프로젝트 : 은행 고객데이터를 이용한 서비스 분석 (1)기초 프로젝트 : 은행 고객데이터를 이용한 서비스 분석프로젝트archivenyc.tistory.com 자꾸 데이터 전처리 단계로 돌아가는 중....ㅠ이지만 중꺾마 마인드로 일단 해보는 중이다.! 🧹 결측치 처리하기결측값 찾기bank.isna().sum()을 활용해 전체 컬럼 중 결측치가 있는 컬럼을 찾았다. 결측값이 발견된 컬럼은 Type of Loan, Num_of_Delayed_Payment, Credit_History_Age, Amount_invested_mont..
기초 프로젝트 : 은행 고객데이터를 이용한 서비스 분석  기초 프로젝트 : 은행 고객데이터를 이용한 서비스 분석 (1)기초 프로젝트 : 은행 고객데이터를 이용한 서비스 분석프로젝트 개요분석 목적 : 은행 고객데이터를 이용해 서비스의 현황을 분석하고 고객을 분류하기.데이터 수집 : Kaggle데이터 소개  Baarchivenyc.tistory.com다시 시작한 전처리..! 그래도 목표가 구체화 된 덕에 오히려 갖고 가야 할 부분과 버리고 가야 할 부분이 명확해져서 좋았다. 몸이 안따라줘서 시간을 많이 쏟지는 못했지만, 그래도 밀도 있게 보낸것 같아 뿌듯했던 하루!🎯 목표 설정나이, 직업, 연간 소득 등의 특성에 따라 고객을 어떻게 세분화할 수 있을까요?→ 고객 ID(Customer_ID)를 기본값으로 ..
👌 FACTS[5/13 - 5/17 진도 정리]데이터 전처리 및 시각화 강의 복습seaborn을 활용한 데이터 시각화💓 FEELINGS이제 프로젝트에 뛰어들 준비가 되었다고 생각했는데, 아직도 프로젝트가 너무 어렵다..ㅠ 할 수 있을것 같은데 막상 이를 코드로 구현하려니 쉽지 않은 것 같다. 앞으로도 공부할게 산더미처럼 쌓여있다는 생각이 들지만, 이번 프로젝트가 지나면 파이썬을 적극적으로 활용할 수 있을 것 같다!💡 FINDINGSpandas를 기반으로 matplotlib과 seaborn을 활용해 다양한 그래프를 그리는 방법을 익혔다.🔮 FUTURE근 한달동안 배운 파이썬 라이브러리들을 프로젝트에 적극적으로 활용해볼 생각이다.! 생각하는것만큼 쉽지는 않을 것 같지만, 최대한 로직을 먼저 생각해보고..
기초 프로젝트 : 은행 고객데이터를 이용한 서비스 분석프로젝트 개요분석 목적 : 은행 고객데이터를 이용해 서비스의 현황을 분석하고 고객을 분류하기.데이터 수집 : Kaggle데이터 소개  Bank User DatasetThis dataset contains user behaviors contributing to their credit scorewww.kaggle.com✅ 전체 컬럼 수  : 50,000개 (같은 고객의 9,10,11,12월치 데이터가 들어있어 실제 total_user의 수는 12,500명)  💡 어려웠던 점 - int, float 타입의 데이터여야 할 것들이 언더바가 붙는(이상값) 경우가 많아 이를 적절히 솎아내기 어려움.- 데이터 description이 없다 보니 데이터 자체를 이해..
240516 Today I Learn seaborn으로 회귀 그래프 그리기 [데이터 시각화] 파이썬으로 그래프 그리기 : seaborn (2) 회귀 그래프, 히트맵 그리기240516 Today I LearnRegression Plotregplot💡regplotsns.regplot(data=데이터프레임, x = "x축에 들어갈 데이터", y = "y축에 들어갈 데이터")scatterplot와 lineplot을 합쳐놓은 그래프lineplot은 scatterplot의 경향성을 예측archivenyc.tistory.comsns.lmplot(data=tips,x='total_bill',y='tip')plt.title('total_bill - tip Regression')회귀식 그리기💡 polyfit평균 제곱 ..
240516 Today I LearnRegression Plotregplot💡regplotsns.regplot(data=데이터프레임, x = "x축에 들어갈 데이터", y = "y축에 들어갈 데이터")scatterplot와 lineplot을 합쳐놓은 그래프lineplot은 scatterplot의 경향성을 예측하는 쪽으로 그어짐sns.regplot(data=tips,x='total_bill',y='tip')lmplot💡 lmplotsns.lmplot(data=데이터프레임, x='x축에 들어갈 컬럼', y='y축에 들어갈 컬럼')regplot과 다르게 hue를 사용해 categorical 변수를 지정해 카테고리별로 각각의 데이터 분포와 선형 관계를 표시할 수 있다.lmplot을 사용해 기본 그래프 그리기..
ny:D
n.archive