classification - k最近邻算法中k的值

标签 classification knn

我有7个类别需要分类，并且有10个功能。在这种情况下，我是否需要使用k的最佳值，还是我必须针对1到10(大约10)之间的k值运行KNN，并借助算法本身确定最佳值？

最佳答案

除了我在评论中发布的the article之外，还有this one，它还建议:

Choice of k is very critical – A small value of k means that noise will have a higher influence on the result. A large value make it computationally expensive and kinda defeats the basic philosophy behind KNN (that points that are near might have similar densities or classes ) .A simple approach to select k is set k = n^(1/2).

这将在很大程度上取决于您的具体情况，有时最好遍历k的每个可能值并自行决定。

关于classification - k最近邻算法中k的值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11568897/

上一篇：emacs - 如何将* shell命令输出*缓冲区保留在后台？

下一篇：如果在 DOM 加载后插入，filepicker.io 小部件将不起作用

相关文章：

machine-learning - 如何在 Sklearn 中将 fit_params 用于带有 VotingClassifier 的 RandomizedSearch？

matlab - 线性判别分析matlab

machine-learning - 二元分类，一个或两个目标？

python - 使用 GridSearchCV best_params_ 给出了糟糕的结果

C++ 固定大小的优先级队列来存储k近邻

sql - 快速最近邻搜索

python - 图像聚类 - 在 GPU 上分配内存

c# - Keras二元分类不同数据集相同预测结果

c# - 图像识别中的K最近邻

python - KNN 归一化的精度差异

©2024 IT工具网联系我们