👌 FACTS[5/7 - 5/10 진도 정리]데이터 분석 파이썬 종합반 복습데이터 전처리 및 시각화 강의 완강python 코드타카💓 FEELINGS파이썬을 어떻게 해야할지 막막하다고 느꼈던게 어제같은데, 이제는 제법 파이썬을 보는 눈이 생긴 것 같다. 옵션이 너무 많아서 모든것을 외워나가는데는 연습이 많이 필요할것 같지만, 점점 생각하는 힘이 길러지는 것 같아서 뿌듯하다. 이번주도 수고했다.💡 FINDINGSpandas, seaborn, matplotlib 패키지를 사용하면서 다양한 패키지를 활용하는 방법을 배웠다. 데이터 시리즈와 데이터 프레임의 차이에 대해 배웠다.🔮 FUTURE아직은 부족함이 많지만, 이번 주 배운 판다스 기초와 파이썬 전처리 및 시각화를 앞으로의 분석에 무궁무진하게 활용할 ..
전체 글
240510 Today I Learn💡 matplotlib시각화를 위한 파이썬 라이브러리 중 하나로, 다양한 종류의 그래프를 생성하기 위한 도구를 제공2D 그래픽을 생성하는 데 주로 사용선 그래프, 막대 그래프, 히스토그램, 산점도, 파이 차트 등 다양한 시각화 방식을 지원그래프를 색상, 스타일, 레이블, 축 범위 등을 조절하여 원하는 형태로 시각화할 수 있음그래프 그리기 도구matplotlib로 그래프 그리기import pandas as pdimport matplotlib.pyplot as plt 💽 예시 데이터셋더보기newjeans = pd.DataFrame({ 'name' : ['Minji','Hanni','Danielle','Haerin', 'Hyein'], 'age' : [20, ..
240510 Today I Learn👾 UnboundLocalError: local variable referenced before assignment함수 밖에서 선언한 변수(Global Variable)를 함수 내(Local Variable)에서 사용/변경 했을 때 발생하는 에러문제상황 프로그래머스코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.programmers.co.krdef solution(answers): tf={} answer = {'1':cnt1, '2':cnt2, '3':cnt3} math = {'1' :[1,2,3,4,5],'2':[2,1,2,3,2,4,2,5], '..
240509 Today I Learn데이터 병합하기데이터 프레임 붙이기 Concat💡 Concat([붙일 데이터 프레임], axis = 상하(0)/좌우(1))pd.concat([df1, df2], axis = 0, ignore_index = False)axis의 기본값은 0(위아래로 붙이기)ignore_index의 기본값은 False(원래 데이터 프레임에서의 인덱스 유지)→ `ignore_index = True`나 `.reset_index(drop=True)`를 활용해 새로운 인덱스를 부여할 수 있음axis = 0 / axis = 1df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2'], 'B': ['B0', 'B1', 'B2']})df2 = pd.DataFrame({'A': [..
240509 Today I Learn💽 활용 데이터셋 Titanic - Machine Learning from Disaster | Kaggle www.kaggle.com# data 불러오기df = pd.read_csv("train.csv") 데이터 확인하기1. 데이터의 정보 확인 : info()💡 dataframe.info()df.info()더보기인덱스, 컬럼명, 컬럼의 데이터 개수, 데이터 타입등 데이터의 정보를 확인null값 확인할 때도 사용한다.상위 5개 값만 추출하기 : head()💡 dataframe.head(n)df.head()더보기dataframe에서 상위 n개의 값을 출력한다.공백일 경우 상위 5개의 값을 출력한다.데이터의 기초통계량 확인하기 : describe()💡 dataf..
240509 Today I Learn💡 데이터 전처리실제 데이터는 원하는 형태로 구축되어있지 않기 떄문에 내가 원하는 데이터를 보기 위해 데이터를 가공해줘야 함. 이 모든 활동을 데이터 전처리라고 한다.데이터를 통해 무엇을 확인할 것인지?어떤 의사결정을 위해 필요한지?데이터를 통해 무엇을 얻고자 하는지?시리즈 vs. 데이터 프레임DataFrame = 표 형태index : 각 아이템을 특정할 수 있는 고유의 값 (엑셀에서는 좌측 열순서로 생각하면됨)columns : 하나의 속성을 가진 데이터 집합Series = 하나의 속성을 가진 데이터 집합 (= DataFrame 표에서 열 1줄이라고 생각하면 쉬움)value + index데이터 불러오기 / 저장하기💡 데이터 불러오기 / 저장하기# 데이터 불러오기d..