240513 Today I Learn๋ฐ์ดํฐ ์ ์ฒ๋ฆฌํ๊ธฐiris ๋ฐ์ดํฐ์
์ ํ์ฉํด์ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌiris_data = sns.load_dataset('iris')iris_data.head()Q1. 'species' ์ด ๊ฐ์ด 'setosa'์ธ ๋ฐ์ดํฐ ์ ํํ๊ธฐiris_data[iris_data['species']=='setosa']→ ์กฐ๊ฑด ์ธ๋ฑ์ฑํ๊ธฐ dataframe[์กฐ๊ฑด]→ .loc๋ฅผ ํ์ฉํ ์๋ ์์. `iris_data.loc[iris_data['species'] == 'setosa']`Q2. 10๋ถํฐ 20๊น์ง์ ํ๊ณผ 1๋ถํฐ 3๊น์ง์ ์ด ์ ํํ๊ธฐiris_data.iloc[10:21,1:4] ๐ .iloc : ์ธ๋ฑ์ค๋ฅผ ์ด์ฉํด์ ๋ฐ์ดํฐ ํ๋ ์ ์ฌ๋ผ์ด์ฑํ๊ธฐ [Pandas] ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ (2) ๊ฒฐ์ธก์น ํ์ธํ..
๐ Today I Learn/๐ Python
240510 Today I Learn๐ก matplotlib์๊ฐํ๋ฅผ ์ํ ํ์ด์ฌ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ค ํ๋๋ก, ๋ค์ํ ์ข
๋ฅ์ ๊ทธ๋ํ๋ฅผ ์์ฑํ๊ธฐ ์ํ ๋๊ตฌ๋ฅผ ์ ๊ณต2D ๊ทธ๋ํฝ์ ์์ฑํ๋ ๋ฐ ์ฃผ๋ก ์ฌ์ฉ์ ๊ทธ๋ํ, ๋ง๋ ๊ทธ๋ํ, ํ์คํ ๊ทธ๋จ, ์ฐ์ ๋, ํ์ด ์ฐจํธ ๋ฑ ๋ค์ํ ์๊ฐํ ๋ฐฉ์์ ์ง์๊ทธ๋ํ๋ฅผ ์์, ์คํ์ผ, ๋ ์ด๋ธ, ์ถ ๋ฒ์ ๋ฑ์ ์กฐ์ ํ์ฌ ์ํ๋ ํํ๋ก ์๊ฐํํ ์ ์์๊ทธ๋ํ ๊ทธ๋ฆฌ๊ธฐ ๋๊ตฌmatplotlib๋ก ๊ทธ๋ํ ๊ทธ๋ฆฌ๊ธฐimport pandas as pdimport matplotlib.pyplot as plt ๐ฝ ์์ ๋ฐ์ดํฐ์
๋๋ณด๊ธฐnewjeans = pd.DataFrame({ 'name' : ['Minji','Hanni','Danielle','Haerin', 'Hyein'], 'age' : [20, ..
240509 Today I Learn๋ฐ์ดํฐ ๋ณํฉํ๊ธฐ๋ฐ์ดํฐ ํ๋ ์ ๋ถ์ด๊ธฐ Concat๐ก Concat([๋ถ์ผ ๋ฐ์ดํฐ ํ๋ ์], axis = ์ํ(0)/์ข์ฐ(1))pd.concat([df1, df2], axis = 0, ignore_index = False)axis์ ๊ธฐ๋ณธ๊ฐ์ 0(์์๋๋ก ๋ถ์ด๊ธฐ)ignore_index์ ๊ธฐ๋ณธ๊ฐ์ False(์๋ ๋ฐ์ดํฐ ํ๋ ์์์์ ์ธ๋ฑ์ค ์ ์ง)→ `ignore_index = True`๋ `.reset_index(drop=True)`๋ฅผ ํ์ฉํด ์๋ก์ด ์ธ๋ฑ์ค๋ฅผ ๋ถ์ฌํ ์ ์์axis = 0 / axis = 1df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2'], 'B': ['B0', 'B1', 'B2']})df2 = pd.DataFrame({'A': [..
240509 Today I Learn๐ฝ ํ์ฉ ๋ฐ์ดํฐ์
Titanic - Machine Learning from Disaster | Kaggle www.kaggle.com# data ๋ถ๋ฌ์ค๊ธฐdf = pd.read_csv("train.csv") ๋ฐ์ดํฐ ํ์ธํ๊ธฐ1. ๋ฐ์ดํฐ์ ์ ๋ณด ํ์ธ : info()๐ก dataframe.info()df.info()๋๋ณด๊ธฐ์ธ๋ฑ์ค, ์ปฌ๋ผ๋ช
, ์ปฌ๋ผ์ ๋ฐ์ดํฐ ๊ฐ์, ๋ฐ์ดํฐ ํ์
๋ฑ ๋ฐ์ดํฐ์ ์ ๋ณด๋ฅผ ํ์ธnull๊ฐ ํ์ธํ ๋๋ ์ฌ์ฉํ๋ค.์์ 5๊ฐ ๊ฐ๋ง ์ถ์ถํ๊ธฐ : head()๐ก dataframe.head(n)df.head()โ๋๋ณด๊ธฐdataframe์์ ์์ n๊ฐ์ ๊ฐ์ ์ถ๋ ฅํ๋ค.๊ณต๋ฐฑ์ผ ๊ฒฝ์ฐ ์์ 5๊ฐ์ ๊ฐ์ ์ถ๋ ฅํ๋ค.๋ฐ์ดํฐ์ ๊ธฐ์ดํต๊ณ๋ ํ์ธํ๊ธฐ : describe()๐ก dataf..
240509 Today I Learn๐ก ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ์ค์ ๋ฐ์ดํฐ๋ ์ํ๋ ํํ๋ก ๊ตฌ์ถ๋์ด์์ง ์๊ธฐ ๋๋ฌธ์ ๋ด๊ฐ ์ํ๋ ๋ฐ์ดํฐ๋ฅผ ๋ณด๊ธฐ ์ํด ๋ฐ์ดํฐ๋ฅผ ๊ฐ๊ณตํด์ค์ผ ํจ. ์ด ๋ชจ๋ ํ๋์ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ๋ผ๊ณ ํ๋ค.๋ฐ์ดํฐ๋ฅผ ํตํด ๋ฌด์์ ํ์ธํ ๊ฒ์ธ์ง?์ด๋ค ์์ฌ๊ฒฐ์ ์ ์ํด ํ์ํ์ง?๋ฐ์ดํฐ๋ฅผ ํตํด ๋ฌด์์ ์ป๊ณ ์ ํ๋์ง?์๋ฆฌ์ฆ vs. ๋ฐ์ดํฐ ํ๋ ์DataFrame = ํ ํํindex : ๊ฐ ์์ดํ
์ ํน์ ํ ์ ์๋ ๊ณ ์ ์ ๊ฐ (์์
์์๋ ์ข์ธก ์ด์์๋ก ์๊ฐํ๋ฉด๋จ)columns : ํ๋์ ์์ฑ์ ๊ฐ์ง ๋ฐ์ดํฐ ์งํฉSeries = ํ๋์ ์์ฑ์ ๊ฐ์ง ๋ฐ์ดํฐ ์งํฉ (= DataFrame ํ์์ ์ด 1์ค์ด๋ผ๊ณ ์๊ฐํ๋ฉด ์ฌ์)value + index๋ฐ์ดํฐ ๋ถ๋ฌ์ค๊ธฐ / ์ ์ฅํ๊ธฐ๐ก ๋ฐ์ดํฐ ๋ถ๋ฌ์ค๊ธฐ / ์ ์ฅํ๊ธฐ# ๋ฐ์ดํฐ ๋ถ๋ฌ์ค๊ธฐd..
240508 Today I Learn๋ฆฌ์คํธ๋ฆฌ์คํธ์ ์์ ์ฝ์
: insert()๐ก Insert : ๋ฆฌ์คํธ์ ํน์ ์์น์ ํน์ ๊ฐ์ ์ฝ์
ํ๋ ํจ์insert(a, b)→ ๋ฆฌ์คํธ์ a๋ฒ์งธ ์์น์ b๋ฅผ ์ฝ์
ํ๋ ํจ์์ด๋ค. ์์ ) movie_rank ๋ฆฌ์คํธ์์ "์ํผ๋งจ"์ "๋ฅํฐ ์คํธ๋ ์ธ์ง"์ "์คํ๋ฆฟ" ์ฌ์ด์ ์ถ๊ฐํ๋ผ.movie_rank = ["๋ฅํฐ ์คํธ๋ ์ธ์ง", "์คํ๋ฆฟ", "๋ญํค"]๋๋ณด๊ธฐmovie_rank.insert(1, '์ํผ๋งจ')print(movie_rank)## '๋ฅํฐ ์คํธ๋ ์ธ์ง', '์ํผ๋งจ', '์คํ๋ฆฟ', '๋ญํค', '๋ฐฐํธ๋งจ'๋ฆฌ์คํธ์์ ์์ ์ญ์ ํ๊ธฐ : del๐ก del : ๋ฆฌ์คํธ์ ํน์ ์์๋ฅผ ์ญ์ ํ๋ ํจ์del ์ญ์ ํ ๊ฐโ์์ ) movie_rank ๋ฆฌ์คํธ์์ '๋ญํค'๋ฅผ ์ญ์ ํ๋ผ.mo..