K-Nearest Neighbor

Instance-Based Learning

Instance-Based Learning을 위해선 거리를 측정하는 방법과 neighbors을 몇 개 사용할 것인지, 근사한 neighbors의 아웃풋들로 어떻게 새로운 아웃풋을 도출할것인지를 해결하는 게 필요하다

1-Nearest Neighbor

1. 거리 측정법 : Euclidean

2. neighbors의 갯수 : 1

3. Combining neighbors' outputs: N/A (Combining 할 필요 없이 가장 가까운 값 택)

1-NN 알고리즘은 (x, y) ... (xn, yn)까지의 traning data들이 주어지고 새로운 x값에 대한 y값을 도출한다

이를 위해 Euclidean 거리 측정방법을 사용하여 새로운 x값에 대해 가장 가까운 기존 x 데이터를 찾고 이 x값에 대한 y값을 새로운 x값에 대한 y값이라 가정한다

k-Nearest Neighbors

1. 거리 측정법 : Euclidean

2. neighbors의 갯수 : k

3. Combining neighbors' outputs:

1) Classification

- majority vote(다수결)

- 가중치가 부여된 다수결로, 가까울수록 영향력이 크다

2) Regression

- 실제값에 대한 평균

- 가중치가 부여된 평균값으로, 가까울수록 영향력이 크다

가장 가까운 neighbor을 찾는데에는 O(n)만큼의 시간이 걸리며, kd-trees를 이용하여 O(logn)으로 시간을 줄일 수 있다

knn 장점

knn 단점

Convolutional neural network(CNN) (0)	2023.11.09

공부 기록