我想找到一种方法来确定我的 knn 算法中实际使用了哪些邻居,这样我就可以更深入地研究与我的特征相似的数据行。
这是一个数据集示例,我将其分为预测模型的训练集和测试集:
Player PER VORP WS
Fabricio Oberto 11.9 1.0 4.1
Eddie Johnson 16.5 1.7 4.8
Tim Legler 15.9 2.0 6.8
Ersan Ilyasova 14.3 0.7 3.8
Kevin Love 25.4 3.5 10.0
Tim Hardaway 20.6 5.1 11.7
Frank Brickowsk 8.6 -0.2 1.6
etc....
这是我的 knn 算法代码的示例:
features = ['PER','VORP']
knn = KNeighborsRegressor(n_neighbors=5, algorithm='brute')
knn.fit(train[features], train['WS'])
predictions = knn.predict(test[features])
现在,我知道该算法将迭代每一行,并根据来 self 指定的目标特征的 5 个最近邻居进行每个目标预测。
我想知道哪 5 个 n_neighbors 实际用于确定我的目标特征?在这种情况下 - 哪些球员实际上被用来确定目标?
有没有办法获取每行分析中使用的 5 个邻居(又名玩家)的列表?
最佳答案
knn.kneighbors
将返回相应最近邻居的数组。
关于python - 当使用k个最近邻居时,有没有办法检索所使用的 "neighbors"?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58617892/