我很想知道 scikitlearn python 模块中是否有内置函数,可以检索错误分类的文档。
这很简单,我通常通过比较预测向量和测试向量并从测试文档数组中检索文档来自己编写它。但我问的是它是否有内置功能,而不是在我编写的每个 python 代码中复制功能。
最佳答案
如果您有一组文档的真实标签 y_test
列表,例如["ham", "spam", "spam", "ham"]
并将其转换为 NumPy 数组,然后您可以将其与一行中的预测进行比较:
import numpy as np
y_test = np.asarray(y_test)
misclassified = np.where(y_test != clf.predict(X_test))
现在 misclassified
是 X_test
的索引数组。
@eickenberg 是对的,这种东西没有在 scikit-learn 中实现,因为用户应该对 NumPy 足够熟悉,可以自己用几行代码来完成。
关于python - 使用 scikit learn 检索错误分类的文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25551977/