我想知道如何使用混淆矩阵情感分析多类分类器来计算精度和召回率。我有一个包含 5000 条文本的数据集,我对 100 条文本的样本进行了人工标记。现在,我想根据该数据样本计算分类器的精度和召回率。我有三门课;积极、中立和消极。
那么如何计算每个类别的这些指标?
由于我是 stackoverflow 的新手,我无法说明我所拥有的混淆矩阵,所以让我们假设我们有以下混淆矩阵:
red color > Negative
green color > Positive
purple color> Neutral
最佳答案
你可以测量
精度=TPos/(TPos+TNeg+TNeu) 即 30/(30+20+10)=50% ,
记忆=TPos/(TPos+FNeg+FNeu) 即 30/(30+50+20)=30% ,
F-measure=2*精度*召回率/(精度+召回率)=37.5%,并且
准确度(全部正确)/(所有数据)=30+60+80/300=56.7% 。
了解更多 http://blog.kaggle.com/2015/10/23/scikit-learn-video-9-better-evaluation-of-classification-models/
关于classification - 如何使用混淆矩阵计算情感分析多类分类器的精度和召回率?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45088949/