라이브러리 불러오기import pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns베이직 문항1. 데이터 불러오기pandas를 import한 다음 데이터를 불러와서 데이터를 확인하세요.# 데이터 불러오기url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data'columns = ['Sepal Length', 'Sepal Width', 'Petal Length', 'Petal Width', 'Species']iris = pd.read_csv(url, header=None, names=columns) 2. 데이터 구조 파악하기데이터셋의 첫 5행을 출력하고, 데이터..
pandas
240514 Today I LearnSeaborn 라이브러리를 이용해 산점도 그리기💡 Seaborn 시각화를 위한 파이썬 라이브러리 중 하나로, 다양한 종류의 그래프를 생성하기 위한 도구를 제공한다.matplotlib 기반비교적 짧은 코드로도 통계학의 주요 그래프를 빠르고 편리하게 만들 수 있음.Seaborn 라이브러리를 이용해 산점도 그리기1. seaborn 라이브러리를 import 해준다.import seaborn as sns2. seaborn 라이브러리에서 산점도를 그리는 함수는 .scatterplot이다.💡 seaborn 라이브러리로 scatter plot 그리기sns.scatterplot(data=데이터 프레임, x=x축에 들어갈 컬럼, y=y축에 들어갈 컬럼)# 이때 x와 y 값에는 df[..
240514 Today I LearnData SelectionGetitem [ ]💡 dataframe['컬럼명']DataFrame에서는 column을 지정하여 데이터를 선택할 수 있다. 선택된 데이터는 series 형태로 반환된다. 예시슬라이싱을 이용해 추출 가능# 같은 결과값을 출력하는 두 코드df[0:3]df["20240513":"20240515"]숫자로 슬라이싱 하는 경우 [시작할 숫자 : 끝날 숫자 +1]문자로 슬라이싱 하는 경우 [시작할 문자 : 끝날 문자]Selection by label💡 loc : 라벨명으로 위치를 지정하여 데이터 추출특정 row를 매칭해 추출하는 경우# dates[0] = '2024-05-13'# row 값이 2024-05-13인 행 추출df.loc[dates[0]]#..
240513 Today I LearnBasic data structures in pandas판다스에서 제공하는 두가지 데이터 타입Series : 1차원 형태의 데이터 (파이썬의 대부분의 타입들이 들어갈 수 있음)DataFrame : 2차원 형태의 표로 이루어진 데이터 (행,열의 개념이 존재함)💡 데이터에서 이야기하는 차원이란?데이터의 속성(Attribute) 개수에 따라 차원을 구분한다.0차원 : schalar(스칼라) → 값1차원 : vector(벡터) → 리스트2차원 : matrix(행렬) → 2중 중첩 리스트3차원이상 : tensor(텐서) → 3중 이상 중첩 리스트Object Creation1. Series 만들기 : 리스트에 값을 넣어서 만들기s = pd.Series([1,3,5,np.na..
240509 Today I Learn데이터 병합하기데이터 프레임 붙이기 Concat💡 Concat([붙일 데이터 프레임], axis = 상하(0)/좌우(1))pd.concat([df1, df2], axis = 0, ignore_index = False)axis의 기본값은 0(위아래로 붙이기)ignore_index의 기본값은 False(원래 데이터 프레임에서의 인덱스 유지)→ `ignore_index = True`나 `.reset_index(drop=True)`를 활용해 새로운 인덱스를 부여할 수 있음axis = 0 / axis = 1df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2'], 'B': ['B0', 'B1', 'B2']})df2 = pd.DataFrame({'A': [..
240509 Today I Learn💽 활용 데이터셋 Titanic - Machine Learning from Disaster | Kaggle www.kaggle.com# data 불러오기df = pd.read_csv("train.csv") 데이터 확인하기1. 데이터의 정보 확인 : info()💡 dataframe.info()df.info()더보기인덱스, 컬럼명, 컬럼의 데이터 개수, 데이터 타입등 데이터의 정보를 확인null값 확인할 때도 사용한다.상위 5개 값만 추출하기 : head()💡 dataframe.head(n)df.head()더보기dataframe에서 상위 n개의 값을 출력한다.공백일 경우 상위 5개의 값을 출력한다.데이터의 기초통계량 확인하기 : describe()💡 dataf..