머신러닝
[Machine Learning] 손글씨데이터 활용 분류 실습
목표 - 손글씨(0-9)를 분류하는 모델을 만들어보자 - 여러모델을 사용해보자 - 이미지 데이터 다루는 방법을 알아보자 도구불러오기 import numpy as np import pandas as pd import matplotlib.pyplot as plt 데이터 불러오기 # train - 학습시킬 때 # test -> 예측할 때 digit_data = pd.read_csv('./digit_train.csv') digit_data .info() - 크기확인 .shape - 결측치 확인 - datatype 확인 digit_data.info() # 42000 행, 785 컬럼 # label to pixel783 # dtypes : int64(785) # 컬러가 흑과 백만 있는 데이터 EDA 데이터를 이미지..
손 글씨 데이터 활용 분류 실습
import warnings warnings.filterwarnings(action = 'ignore') # 일반화 성능 검사 (교차검증) # 검증을 5번 실행했을때 모델이 가지는 일반적인 정확도 성능 정도 확인 knn_result = cross_val_score(knn_model,X_train,y_train, cv=5) tree_result = cross_val_score(tree_model,X_train,y_train, cv=5) logi_result = cross_val_score(logi_model,X_train,y_train, cv=5) svm_result = cross_val_score(svm_model,X_train,y_train, cv=5) # 도구 불러오기 import numpy as n..
ex01_타이타닉데이터활용_생존,사망분류실습
1 머신러닝 과정 문제정의 : 프젝목적, 어떤 모델 만들지?, 지도학습 vs 비지도학습, 자료조사 데이터 수집 데이터 전처리 : 분석 전에 깔끔하게 만들어 줌(이상치 제거, 결측치 처리) 탐색적 데이터 분석 : 컬럼(변수)간의 관계확인, 기술통계량 모델 선택 및 학습 모델 예측 및 평가 모델을 가지고 서비스화(웹,앱) 2 목표 생존자/사망자 예측하는 모델을 만들어보자 머신러닝 모델 종류는 여러가지지만 tree모델 사용해보자 머신러닝 전체 과정을 체험해보자 kaggle 경진대회에 참여해서 순위를 확인해보자 3 데이터 수집 kaggle 사이트로부터 train, test, submission 다운로드 train : 학습 시키기 위한 데이터 test : 학습이 잘 됐는지 예측해보기 위한 데이터 submissio..
머신러닝을 위한 pandas와 matplotlib 예제
1 목표 목적 : 머신러닝을 위해 pandas 와 matplotlib의 개념을 정립해보자 목표 : 우리반의 대답봇이자 분위기 메이커를 알아보자 6월 27일 부터 7월 1일까지의 카톡 빈도수 추이 확인해보자 문자열 전처리를 해보자 import pandas as pd # 1,2차원의 테이블 형식 데이터를 다루는 모듈 import matplotlib.pyplot as plt # 시각화 도와주는 모듈 # 한국어 처리 - 글꼴 설정 from matplotlib import rc rc('font',family = 'Malgun Gothic') # 판다스 기본 옵션 설정 pd.set_option('display.max_colwidth',None) ai_class ai_class = pd.DataFrame([['202..
머신러닝 기본 개념
◆ 인공지능의 역사 ◆ 인공지능의 종류 ◆ 인공지능의 미래 ◆ 인공지능 윤리 ◆ 머신러닝이란? ◆ 머신러닝 vs 딥러닝 ◆ 머신러닝 종류 • 데이터에 대한 Label(명시적인 답) 이 주어진 상태에서 컴퓨터를 학습시키는 방법 • 분류(Classification)와 회귀(Regression)로 나뉘어진다. • 미리 정의된 여러 클래스 레이블 중 하나를 예측하는 것 • 속성 값을 입력, 클래스 값을 출력으로 하는 모델 • 붓꽃(iris)의 세 품종 중 하나로 분류, 암 분류 등 • 이진분류, 다중 분류 등이 있다. • 연속적인 숫자를 예측하는 것 • 속성 값을 입력, 연속적인 실수 값을 출력으로 하는 모델 • 어떤 사람의 교육수준, 나이, 주거지를 바탕..