본문 바로가기

두두의 IT/Machine Learning

(4)
[머신러닝4] 실전연습/KNN 알고리즘으로 z-score 구하기 In [1]: from IPython.core.display import display, HTML display(HTML("")) In [126]: import pandas as pd from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import train_test_split import numpy as np In [127]: df = pd.read_csv("./wine.csv") In [128]: df Out[128]: fixed acidity volatile acidity citric acid residual sugar chlorides free sulfur dioxide total sulfur dioxide..
[머신러닝3] K-최근접 이웃/표준점수(z-score) In [54]: from IPython.core.display import display, HTML display(HTML("")) 데이터 전처리¶ 구글 코랩에서 실행하기 넘파이로 데이터 준비하기¶ In [2]: fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0, 9.8, 10.5, 10.6, 11.0, 11.2, 11.3, 11.8, 11.8, 12.0, 1..
[머신러닝2] 불확실성/샘플링편향/훈련세트/테스트세트 불확실성¶ 미래는 언제나 불확실하며 지능이 있는 생명체는 생존을 위해서 불확실성을 제거하는 데 모든 것을 집중한다. 예측이 곧 지능의 핵심 기능이다. 1. 불확실성의 유형¶ 자료의 불확실성 자료를 획득할 수 있는 기계 또는 센서 장치의 부정확성에서 기인한다. 따라서 이렇게 얻어진 자료는 오차를 포함하고 있다. 게다가 자료 수집 단계에서 관측되지 않는 미확인 자료들도 있으니 수집한 자료가 완벽하다고 할 수 없다. 정보(Infomation)의 불완전성 무인 자동차의 경우 주행 시 발생하는 모든 상황에 대한 방대한 정보를 모두 다 입력받아 처리할 수 없다. 따라서 일부의 정보만 받아들여 판단해야 하므로 정보가 불완전하다고 할 수 있다. 지식(Knowledge)의 불확실성 지식의 표현이 자연어로 처리될 때 인간..
[머신러닝1] 개념/통계와의 차이/이진분류/K-최근접 이웃(K-Nearest Neighbors) 머신러닝¶ 규칙을 일일이 프로그래밍하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야 인공지능의 하위 분야 중에서 지능을 구현하기 위한 소프트웨어를 담당하는 핵심 분야 1. 머신러닝과 통계의 차이¶ 통계나 수학 이론보다 경험을 바탕으로 발전 머신러닝 체제에서는 정답이 있는 데이터를 정답과 같이 머신러닝 모형(알고리즘)에 넣어주면 적절한 절차가 나타납니다. 정답이 있는 데이터가 충분하다면 절차는 더욱 의미 있어지고 그 절차를 기반으로 새로운 데이터를 이용한 분류 또는 예측을 할 수 있습니다. 통계학¶ 작은 수의 데이터로부터 일반적 결론을 도출할 수 있는 확률이론 기반 통계적 추론을 중심으로 함 ex) 왜 이 사람에게 이런 영화 추천 결과가 나왔는지 머신러닝¶ 대량의 데이터. 결과 중심..

LIST