algorithm - KNN 算法中需要归一化

标签 algorithm machine-learning normalization knn nearest-neighbor

为什么在 KNN 中需要规范化?我知道这个过程标准化了所有特征对结果的影响,但是在标准化之前到特定点 V 的“K”最近点将与到该特定点的“K”最近点完全相同归一化后的 V。那么归一化对欧氏距离有何影响。毕竟 KNN 完全取决于欧几里得距离? 提前致谢!

最佳答案

如果您在不同的维度上有不同的可变性,大多数归一化技术都会改变“K”个最近的邻居。

想象一下 A=(-5,0)、B=(-5,1) 和 C=(5,1) 的数据集。现在考虑一个兴趣点 (4.5, 0)。显然,C 是最近的邻居。

在两个维度上最小-最大归一化为 (-1,1) 后,您的数据集变为 A=(-1, -1), B=(-1,1), C=(1,1)。您的兴趣点对应于这个新空间中的 (0.9, -1)。因此,A 现在是最近的邻居。

关于algorithm - KNN 算法中需要归一化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51300891/

相关文章:

计算一定深度的 Minimax Tree 中的移动分数

algorithm - 在单峰数组中找到第 k 个元素

python - 我是否需要使用装箱算法或背包?

machine-learning - keras fit 与 keras 评估

mysql - 在数据库中,什么时候应该存储派生数据?

r - 如何将数据系列规范化为起始值 = 0?

algorithm - 仅使用多头计算迭代概率

c++ - Opencv 3 支持 vector 机训练

machine-learning - 无法理解 Keras ConvLSTM2D - 已编辑

database - 数据库规范化和单场突破