ML : Machine Learning 개념과 종류 : 개념과 종류
정의 머신러닝은 f(x)라는 함수, 머신러닝 알고리즘을 만들어 X라는 입력변수를 받으면 Y라는 종속변수를 출력하는 과정이다. 또한 회귀분석의 경우 모집단을 잘 알지 못하기 때문에, 학습데이터만 추출하여 추정하는 머신러닝 알고리즘을 만든다. 예시 지도학습 vs 비지도학습 지도학습 (Supervised) 비지도학습 (UnSupervised) Y = F(x) 일 때, Y는 연속형 변수, X는 연속 or 이산형 변수, F는 회귀모형 Y는 이산형 변수(class), X는 연속 or 이산형 변수, F는 분류모형 출력변수는 존재하지 않고, 입력 변수 (X) 간의 관계에 대해 모델링을 하는 것. 회귀모형, 분류모형 군집분석(유사데이터), PCA(독립변수들의 차원축소화) ML의 종류 선형 회귀분석 (Linear Regr..
2020. 3. 7.
자연어 처리 : 문서 유사도 : 유클리드, 코사인, 자카드
1. Euclidean Distance Similarity 좌표를 word들이라고 가정을 해보자. (5,1)과 다른 단어들을 유사도 측정을 해볼 때, 거리는 피타고라스 정리로 구할 수 있다. 여기서 거리가 짧으면 단어들끼리 유사도가 높고, 거리가 길면 단어들끼리 유사도가 낮다고 판단한다. import numpy as np def dist(x,y): return np.sqrt(np.sum((x-y)**2)) doc1 = np.array((2,3,0,1)) doc2 = np.array((1,2,3,1)) doc3 = np.array((2,1,2,2)) docQ = np.array((1,1,0,1)) print(dist(doc1,docQ)) print(dist(doc2,docQ)) print(dist(doc3..
2020. 3. 6.