라이브러리 불러오기# 기본 라이브러리 불러오기import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns베이직 문항1. Iris 데이터셋에서 Logistic Regression 분류Iris 데이터셋을 사용하여 Logistic Regression 모델을 학습시키고, 정확도(accuracy)를 계산하세요풀이과정데이터 불러오기test, train 데이터 나누기💡 train_test_split에서 stratify의 역할클래스의 분포 비율을 맞춰서 데이터를 나눠준다.→ stratify 유무에 따라 accuracy에 차이가 있다. 교차검증 정확도가 1인 것 보다는 , 0.933이 더 신뢰가능한 수준이라고 판단해 s..
전체 글
240612 Today I Learn딥러닝 이론머신러닝 vs. 딥러닝💡 머신러닝과 딥러닝은 모두 데이터로부터 가중치를 학습하여 패턴을 인식하고 결정을 내리는 알고리즘 개발과 관련된 인공지능(AI)의 하위 분야이다.머신러닝: 데이터 안의 통계적 관계를 찾아내며 예측이나 분류류를 하는 방법딥러닝: 머신러닝의 한 분야로 신경세포 구조를 모방한 인공 신경망*을 사용함.* 인공신경망 : 인간의 신경세포를 모방하여 만든 망(Networks). 인공신경망의 가장 작은 단위를 퍼셉트론이라고 한다.Gradient Descent💡 경사 하강법(Gradient Descent)인공신경망 오차함수의 최솟값*을 찾아가는 최적화 기법회귀 문제의 경우 가중치(weight)를 이리 저리 움직이면서 최소의 MSE를 도출하는 것.함수..
240612 Today I Learn👾 ModuleNotFoundError: No module named 'tensorflow.keras'사용하려는 모듈을 찾을 수 없다. 이 경우 'tensorflow.keras'라는 모듈을 찾을 수 없다는 것을 의미문제상황 tensorflow.keras를 불러오는 과정에서 module을 찾을 수 없다는 에러가 발생했다. 문제해결을 도와주신 튜터님께서 말씀하시길.. keras를 이용할 때 이러한 오류를 겪는 케이스가 많다고 한다. 대부분의 경우, from tensorflow.python.keras.datasets 이렇게 중간에 파이썬이라는 경로를 추가해주면 해결된다고 하는데 이 방법으로 해결이 되지 않는 다면 아래의 글이 도움이 될 것 같다. 🔍 에러탐색Modul..
240612 Today I Learn머신러닝머신러닝 알고리즘의 종류지도 학습 (Supervised Learning)비지도 학습 (Unservised Learning)강화 학습 (Reinforcement Learning)머신러닝 모델 성능 평가 지표정확도 Accuracy = (True Positive +True Negative)/TotalAccuracy 가 만능일 수 없는 이유어떤 회사에서 100명중 2명을 암환자로 예측하는 모델을 만들고 싶을 때, accuracy를 가장 높게 할 수 있는 방법은 무엇일까?바로 100명의 환자를 모두 암환자라고 분류하는 모델을 만드는 것이다. 100명의 환자를 모두 암환자로 분류하는 모델의 정확도는 무려 98%가 된다. 그렇다면 이 회사는 '저희 모델은 98%의 정확도로..
240611 Today I Learn비지도 학습 💡 비지도학습답을 알려주지 않고 공부시키는 방법- 연관규칙- 군집화 K-Means Clustering💡 K-Means Clustering주어진 데이터를 k개의 클러스터로 묶는 알고리즘으로, 각 클러스터와 거리 차이의 분산을 최소화하는 방식으로 동작한다.장점 : 일반적이고 적용하기 쉬움단점거리 기반으로 가까움을 측정하기 때문에 차원이 많을 수록 정확도가 떨어짐반복 횟수가 많을 수록 시간이 느려짐몇 개의 군집(K)을 선정할지 주관적임평균을 이용하기 때문에(중심점) 이상치에 취약함좋은 군집화란?실루엣 값이 높을수록(1에 가까움)개별 군집의 평균 값의 편차가 크지 않을 수록 좋은 군집화이다.군집화 실습 - iris데이터 및 라이브러리를 불러오기# 기본 라이브러..
240610 Today I Learn의사결정나무와 랜덤 포레스트더보기# 라이브러리 및 데이터 불러오기import pandas as pdimport matplotlib.pyplot as plttitanic = pd.read_csv('TITANIC/train.csv')# 전처리#Pclass: LabelEncoderfrom sklearn.preprocessing import LabelEncoderle1 = LabelEncoder()titanic['Pclass'] = le1.fit_transform(titanic['Pclass'])#Sex: LabelEncoderle2 = LabelEncoder()titanic['Sex'] = le2.fit_transform(titanic['Sex'])#Age: 결측치-> 평균..