240509 Today I Learn💡 데이터 전처리실제 데이터는 원하는 형태로 구축되어있지 않기 떄문에 내가 원하는 데이터를 보기 위해 데이터를 가공해줘야 함. 이 모든 활동을 데이터 전처리라고 한다.데이터를 통해 무엇을 확인할 것인지?어떤 의사결정을 위해 필요한지?데이터를 통해 무엇을 얻고자 하는지?시리즈 vs. 데이터 프레임DataFrame = 표 형태index : 각 아이템을 특정할 수 있는 고유의 값 (엑셀에서는 좌측 열순서로 생각하면됨)columns : 하나의 속성을 가진 데이터 집합Series = 하나의 속성을 가진 데이터 집합 (= DataFrame 표에서 열 1줄이라고 생각하면 쉬움)value + index데이터 불러오기 / 저장하기💡 데이터 불러오기 / 저장하기# 데이터 불러오기d..
pandas
베이직 문항1. 데이터 불러오기타이타닉 데이터를 불러온 다음 df라는 변수에 담고 데이터의 내용을 확인하세요.import pandas as pddf = pd.read_csv('train.csv')print(df)확장자에 따른 파일 데이터 프레임으로 불러오기 → Pandas library 활용하기read_csv : csv 파일 불러오기read_excel : excel 파일 불러오기2. 생존자 수 계산타이타닉 전체 생존자 수와 사망자 수를 계산하고 출력하세요.survival = df['Survived']dead =0survived =0for i in survival: if i ==0: dead+=1 else: survived +=1print(f"사망자는 {dead}명, 생..
240430 Today I LearnPandas '.loc[]' 데이터프레임에서 행 조회하기💡 dataframe.loc[ 행 인덱싱 값, 열 인덱싱 값]라벨로 인덱싱, 끝번호 포함슬라이싱 개념 적용 가능▶︎ 활용 예시 ) 가장 많은 가족을 가진 승객 찾기family = df['SibSp']+df['Parch']name = ''for i, k in enumerate(family): if k == max(family): print(df.loc[i]['Name']) ## Sage, Master. Thomas Henry## Sage, Miss. Constance Gladys## Sage, Mr. Frederick## Sage, Mr. George John Jr## Sage, Mi..