k-NN이란?
•
k개의 가장 가까운 이웃 (Nearest Neighbor) ⇒ k-NN
•
k-NN의 값 또는 클래스를 평균 또는 다수결 등의 방법으로 고려하여 새로운 데이터의 값 또는 클래스를 추정하는 기법
가장 적절한 k는 어떻게 결정할까?
여러 번 해 볼 수 밖에 없다.
가장 가까운 이웃은어떻게 결정할까?
•
“거리”를 정의하는 여러가지 방법
◦
유클리드 거리 (Eunclidean distance)
피타고라스 정리가 적용되는.. 가장 많이 쓰인다.
직교 좌표계..
◦
마할라노비스 거리 ( Mahalanobis distance )
모형 학습
•
k-NN 분류분석 수행 : scikit-learn (sklearn)
◦
‘이웃’ 모듈 - sklearn의 neighbors