python - 有没有一种简单的方法来获得多类分类的混淆矩阵? (OneVsRest)

标签 python pandas numpy scikit-learn multilabel-classification

我在三类分类问题(三个随机森林)上使用 OneVsRest 分类器。每个类的出现都定义了我的虚拟整数(1 代表出现,0 代表其他)。我想知道是否有一种简单的替代方法来创建混淆矩阵?正如我遇到的所有方法一样,采用 y_pred、y_train = array、shape = [n_samples] 形式的参数。理想情况下,我想要 y_pred, y_train = array , shape = [n_samples, n_classes]

一些样本,类似于问题的结构:

y_train = np.array([(1,0,0), (1,0,0), (0,0,1), (1,0,0), (0,1,0)])
y_pred = np.array([(1,0,0), (0,1,0), (0,0,1), (0,1,0), (1,0,0)])


print(metrics.confusion_matrix(y_train, y_pred) 

返回: 不支持多标签指示器

最佳答案

我不知道你在想什么,因为你没有指定你正在寻找的输出,但你可以通过以下两种方式实现它:

1.每列一个混淆矩阵

In [1]:
for i in range(y_train.shape[1]):
    print("Col {}".format(i))
    print(metrics.confusion_matrix(y_train[:,i], y_pred[:,i]))
    print("")

Out[1]:
Col 0
[[1 1]
 [2 1]]

Col 1
[[2 2]
 [1 0]]

Col 2
[[4 0]
 [0 1]]

2.一共一个混淆矩阵

为此,我们要展平数组:

In [2]: print(metrics.confusion_matrix(y_train.flatten(), y_pred.flatten()))

Out[2]:
[[7 3]
 [3 2]]

关于python - 有没有一种简单的方法来获得多类分类的混淆矩阵? (OneVsRest),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41013510/

相关文章:

python - 为什么我的 __init__.py 在模块中不起作用?

python - 尽管密度极低,但使用稀疏的 Pandas 数据帧没有空间优势

python - Dataframe - 根据条件创建新列

java - Python脚本参数化

python - 在 pandas 中填充 DataFrame

Python pandas "filter"仅交易日的时间序列

python - 在 Azure Functions 中安装requirements.txt 时无法解析对 numpy 的依赖关系

python - 与线性表达式相乘时求非线性表达式的根

python - 如何在 Python 中使用部分旋转实现 LU 分解?

python - 通过使用 pandas 对列进行分组来汇总数据框