Search

#017 #k-NN의 이해

k-NN이란?

k개의 가장 가까운 이웃 (Nearest Neighbor) ⇒ k-NN
k-NN의 값 또는 클래스를 평균 또는 다수결 등의 방법으로 고려하여 새로운 데이터의 값 또는 클래스를 추정하는 기법

가장 적절한 k는 어떻게 결정할까?

여러 번 해 볼 수 밖에 없다.

가장 가까운 이웃은어떻게 결정할까?

“거리”를 정의하는 여러가지 방법
유클리드 거리 (Eunclidean distance)
피타고라스 정리가 적용되는.. 가장 많이 쓰인다. 직교 좌표계..
마할라노비스 거리 ( Mahalanobis distance )
C는 공분산(covariance) 행렬

모형 학습

k-NN 분류분석 수행 : scikit-learn (sklearn)
‘이웃’ 모듈 - sklearn의 neighbors