algorithm - KNN 算法中需要归一化

为什么在 KNN 中需要规范化？我知道这个过程标准化了所有特征对结果的影响，但是在标准化之前到特定点 V 的“K”最近点将与到该特定点的“K”最近点完全相同归一化后的 V。那么归一化对欧氏距离有何影响。毕竟 KNN 完全取决于欧几里得距离？提前致谢!

最佳答案

如果您在不同的维度上有不同的可变性，大多数归一化技术都会改变“K”个最近的邻居。

想象一下 A=(-5,0)、B=(-5,1) 和 C=(5,1) 的数据集。现在考虑一个兴趣点 (4.5, 0)。显然，C 是最近的邻居。

在两个维度上最小-最大归一化为 (-1,1) 后，您的数据集变为 A=(-1, -1), B=(-1,1), C=(1,1)。您的兴趣点对应于这个新空间中的 (0.9, -1)。因此，A 现在是最近的邻居。

关于algorithm - KNN 算法中需要归一化，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51300891/

相关文章：

计算一定深度的 Minimax Tree 中的移动分数