ํ์ผ ๋ถ๋ฌ์ค๊ธฐ ๋ฐ ์ ์ฅํ๊ธฐ
ํ์ฅ์์ ๋ฐ๋ฅธ ํ์ผ ๋ถ๋ฌ์ค๊ธฐ
- csv ํ์ผ
import pandas as pd
df = pd.read_csv('file.csv')
- excel ํ์ผ
python
import pandas as pd
df = pd.read_excel('file.xlsx')
- txt ํ์ผ
import pandas as pd
df = pd.read_csv('file.txt', delimiter='\t')
→ ๋ง์ฝ ํญ์ผ๋ก ๊ตฌ๋ถ๋์ด ์๋ค๋ฉด `delimiter='\t'`๋ฅผ ์ฌ์ฉํฉ๋๋ค.
ํ์ผ ์ ์ฅํ๊ธฐ
- csv ํ์ผ ์ ์ฅํ๊ธฐ
import pandas as pd
df = pd.DataFrame(data)
df.to_csv(ํ์ผ ๊ฒฝ๋ก, index = False)
- txt ํ์ผ ์ ์ฅํ๊ธฐ
with open(ํ
์คํธํ์ผ ์ ์ฅํ ๊ฒฝ๋ก, 'w') as ํ์ผ๋ช
:
for key, item in data.items():
textfile.write(str(key) + " : " + str(item) + '\n')
→ key ์ item์ ๊ฐ๊ฐ string ํํ๋ก ๋ณํํ ๋ค ํ ์ค ์ฉ ๋์์(\n) ์ ์ฅ
ํจํค์ง ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ฌ์ฉํ๊ธฐ
ํจํค์ง๋?
๐ ํจํค์ง : ๊ด๋ จ๋ ์ฌ๋ฌ ๊ฐ์ ๋ชจ๋์ ํฌํจํ๋ ๋๋ ํ ๋ฆฌ
- ๋ฐ์ดํฐ ์์ง, ์ ์ฒ๋ฆฌ, ์๊ฐํ, ๋ชจ๋ธ๋ง, ํต๊ณ ๋ถ์ ๋ฑ ๋ค์ํ ๊ธฐ๋ฅ์ ์ ๊ณต
- ์ฝ๋์ ์ฌ์ฌ์ฉ์ฑ์ ๋์ด๊ณ , ๊ฐ๋ฐ ์๋๋ฅผ ๋น ๋ฅด๊ฒ ํ๋ฉฐ, ์ฝ๋์ ๊ฐ๋ ์ฑ์ ํฅ์์ํค๋๋ฐ ๋์
ํจํค์ง ๋ถ๋ฌ์ค๊ธฐ
import ํจํค์ง๋ช
as ๋ณ๋ช
→ ๋ค์๊ณผ ๊ฐ์ด ํจํค์ง์ ์๋ ํน์ ํจ์๋ฅผ ๋ถ๋ฌ์ฌ ์๋ ์์
from sklearn.datasets import load_iris
๋ค์ํ ์ข ๋ฅ์ ํจํค์ง
๐ง ๋ฐ์ดํฐ ๋ถ์ ํจํค์ง
๐ผ Pandas : ๋ฐ์ดํฐ ์กฐ์๊ณผ ๋ถ์์ ์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก, ๋ฐ์ดํฐ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์กฐ์ํ๊ณ ๋ถ์ํ ์ ์๋๋ก ๋์์ค
import pandas as pdโ
๐ฅง numpy : ๊ณผํ์ ๊ณ์ฐ์ ์ํ ํต์ฌ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก, ๋ค์ฐจ์ ๋ฐฐ์ด๊ณผ ํ๋ ฌ ์ฐ์ฐ์ ์ง์
import numpy as np
๐จ ๋ฐ์ดํฐ ์๊ฐํ ํจํค์ง
๐ matplotlib : ๋ฐ์ดํฐ ์๊ฐํ๋ฅผ ์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก, ๋ค์ํ ๊ทธ๋ํ์ ํ๋กฏ์ ์์ฑํ ์ ์์ต๋๋ค.
import matplotlib.pyplot as plt
๐ฆญ seaborn : Matplotlib์ ๊ธฐ๋ฐ์ผ๋ก ํ ํต๊ณ์ฉ ๋ฐ์ดํฐ ์๊ฐํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก, ๋ณด๋ค ๊ฐํธํ๊ณ ์๋ฆ๋ค์ด ์๊ฐํ๋ฅผ ์ ๊ณต
import seaborn as sns
๐ง ๋ฅ๋ฌ๋
๐ Tensorflow : ๋ฅ๋ฌ๋ ๋ฐ ๊ธฐ๊ณ ํ์ต์ ์ํ ์คํ์์ค ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก, ๊ตฌ๊ธ์์ ๊ฐ๋ฐํ์ต๋๋ค. ๊ทธ๋ํ ๊ธฐ๋ฐ์ ๊ณ์ฐ์ ํตํด ์์น ๊ณ์ฐ์ ์ํํ๋ฉฐ, ์ ๊ฒฝ๋ง์ ๊ตฌ์ถํ๊ณ ํ์ตํ ์ ์๋ค.
import tensorflow as tf
๐ฅ Pytorch : ๋ฅ๋ฌ๋์ ์ํ ์คํ์์ค ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก, Facebook์์ ๊ฐ๋ฐํ์ต๋๋ค. ๋์ ๊ณ์ฐ ๊ทธ๋ํ๋ฅผ ์ฌ์ฉํ์ฌ ์ ๊ฒฝ๋ง์ ๊ตฌ์ถํ๊ณ ํ์ตํ ์ ์๋ค.
import torch
import torch.nn as nn
ํฌ๋งทํ (formatting) ๋ฐฉ๋ฒ
x ๊ฐ 10์ด๋ผ๊ณ ํ ๋, `๋ณ์ x์ ๊ฐ์ (10)์ ๋๋ค.`๋ผ๋ ๋ฌธ์ฅ์ ์ถ๋ ฅํด๋ณด์. (๋จ, x๊ฐ์ ๋ฐ๋ผ ๋ณํํด์ผํ๋ค.)
๐๏ธ f-string
ํ์ด์ฌ 3.6 ์ด์์์๋ง ๊ฐ๋ฅ
x = 10
print(f"๋ณ์ x์ ๊ฐ์ {x}์
๋๋ค.")
→ ๋ฐ์ดํ ์์ f๋ฅผ ์์ฑํด์ฃผ๊ณ ํฌ๋งทํ ํ ๊ฐ(์ด ๊ฒฝ์ฐ x)์ ์ค๊ดํธ{} ์์ ๋ฃ์ด์ค๋ค.
format ๋ฉ์๋ ์ฌ์ฉ
x = 10
print("๋ณ์ x์ ๊ฐ์ {}์
๋๋ค.".format(x))
→ ๋ฐ์ดํ ์์ ์ถ๋ ฅํ ํฌ๋งท์ ์ ๋ ฅํ๊ณ , ํฌ๋งทํ ํ ๊ฐ(์ด ๊ฒฝ์ฐ x)์ ์๋ฆฌ์ {}์ค๊ดํธ๋ฅผ ์ ๋ ฅํ๋ค.
→ ํด๋น ๋ฌธ์ฅ์ ๋ค์ `.format(ํฌ๋งทํ ํ ๊ฐ)`์ ๋ฃ์ด์ฃผ๋ฉด ์์ฑ
% ์ฌ์ฉํ๊ธฐ
x = 10
print("๋ณ์ x์ ๊ฐ์ %d์
๋๋ค." % (x))
→ ๋ฐ์ดํ ์์ ์ถ๋ ฅํ ํฌ๋งท์ ์ ๋ ฅํ๊ณ , ํฌ๋งทํ ํ ๊ฐ์ ์๋ฆฌ์ %s ๋๋ %d(๋ฌธ์์ธ ๊ฒฝ์ฐ %s, ์ซ์์ธ ๊ฒฝ์ฐ %d)๋ฅผ ์ ๋ ฅํ๋ค.
→ ํด๋น ๋ฌธ์ฅ์ ๋ค์ `% (ํฌ๋งทํ ํ ๊ฐ)`์ ๋ฃ์ด์ฃผ๋ฉด ์์ฑ
'๐ Today I Learn > ๐ Python' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
์๋ฉด ์ ์ฉํ ํ์ด์ฌ ๋ฌธ๋ฒ (3) glob, os, split (0) | 2024.05.07 |
---|---|
์๋ฉด ์ ์ฉํ ํ์ด์ฌ ๋ฌธ๋ฒ (2) ๋ฆฌ์คํธ ์ปดํ๋ฆฌํจ์ , lambda (0) | 2024.05.07 |
[๊ฐ์ธ ๊ณผ์ ] ํ์ดํ๋ ๋ฌธ์ ํ์ด (1) (0) | 2024.05.06 |
ํ์ด์ฌ ํจ์ (2) ๋งค๊ฐ๋ณ์ vs. ์ธ์ (0) | 2024.05.05 |
[Pandas] ์ ์ฉํ ํ๋ค์ค ํจ์ (.loc / .groupby/ .idxmax) (0) | 2024.05.05 |