classification - 如何使用混淆矩阵计算情感分析多类分类器的精度和召回率?

标签 classification sentiment-analysis

我想知道如何使用混淆矩阵情感分析多类分类器来计算精度和召回率。我有一个包含 5000 条文本的数据集,我对 100 条文本的样本进行了人工标记。现在,我想根据该数据样本计算分类器的精度和召回率。我有三门课;积极、中立和消极。

那么如何计算每个类别的这些指标?

由于我是 stackoverflow 的新手,我无法说明我所拥有的混淆矩阵,所以让我们假设我们有以下混淆矩阵:

red color   > Negative
green color > Positive
purple color> Neutral

enter image description here

最佳答案

你可以测量

精度=TPos/(TPos+TNeg+TNeu) 即 30/(30+20+10)=50% ,

记忆=TPos/(TPos+FNeg+FNeu) 即 30/(30+50+20)=30% ,

F-measure=2*精度*召回率/(精度+召回率)=37.5%,并且

准确度(全部正确)/(所有数据)=30+60+80/300=56.7% 。

了解更多 http://blog.kaggle.com/2015/10/23/scikit-learn-video-9-better-evaluation-of-classification-models/

关于classification - 如何使用混淆矩阵计算情感分析多类分类器的精度和召回率?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45088949/

相关文章:

python - sklearn SVM 表现非常差

swift - 使用 Swift 请求错误 Google Cloud NLP API

algorithm - 什么是监督 ML 分类算法?

machine-learning - 选择通过浏览历史估计用户性别的算法

classification - Vowpal Wabbit 中的纠错锦标赛(等)多类别分类

twitter - requests.exceptions.ChunkedEncodingError : ('Connection broken: IncompleteRead(0 bytes read, 512 more expected)' , IncompleteRead

python - NLTK 和停用词失败 #lookuperror

nlp - 实体情感分析(实体级情感分析)

python - 用于二进制分类的 spark 逻辑回归 : apply new threshold for predicting 2 classes