python - MAXent分类器NLTK输出理解

标签 python machine-learning nltk text-classification

我正在尝试了解 MAXent 分类器的classifier.show_most_informative_features(10)。我不明白这些列表示什么,例如在以下输出中:

train on 460 instances, test on 154 instances accuracy: 0.61038961039 
pos precision: 0.432989690722 
pos recall: 0.893617021277 
neg precision: 0.912280701754 
neg recall: 0.485981308411    
-4.141 need==True and label is 'REL'    
3.395 approves==True and label is 'IRREL'   -
3.308 took==True and label is 'IRREL' 
-1.766 treat==True and label is 'REL' 
-1.488 tired==True and label is 'IRREL' 
-1.295 gave==True and label is 'IRREL' 
0.879 need==True and label is 'IRREL' 

最佳答案

您似乎有两个标签,“RELEVANT”“IRRELEVANT”。当有两个标签时,一个通常命名为“1”或正,另一个命名为“-1”或负。

在训练过程中,分类器分析了 460 个训练实例的特征,并根据它们区分两个标签的能力对其进行加权。加权过程的详细信息取决于您选择的算法。

阳性精度:在测试期间被分类为标签 1 的 154 个测试实例中,有 43% 确实具有标签 1。

正召回率:测试集中 89% 的标签 1 实例被发现,即被分类为标签 1。

负精度/负召回是相同的,但对于标签 -1。

准确性:154 个测试实例中有 61% 的标签正确。

特征根据其绝对值进行排序,该绝对值对应于它们与分类的相关性。在这种情况下,最“有用”的功能是需要,如果这是真的,这是一个很好的暗示,实例的标签应该是“相关”。

关于python - MAXent分类器NLTK输出理解,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16266842/

相关文章:

python - 如何使用pygame播放音乐(Python)

machine-learning - 神经网络可以有整数输入吗?

machine-learning - 比自组织 map 更好或替代的方法来获得数据的基本理解/关系

machine-learning - id3决策树程序

ubuntu - Ubuntu 500 上的 flask /nginx/gunicorn 中的 NLTK+TextBlob 错误

python - NLTK WordNet Lemmatizer : Shouldn't it lemmatize all inflections of a word?

python:我可以将字符串格式化运算符与类的 getter 方法一起使用吗?

python - 使用python从mp3音频文件中获取振幅数据

python - 在 ubuntu 中导入 pyautogui 抛出 KEYERROR :DISPLAY

nlp - 使用 NLTK python 的因果句提取