nlp - 在NLTK中选择哪个分类器

标签 nlp classification nltk

我想将短信分为几个类别,如“建立关系”、“协调”、“信息共享”、“知识共享”和“冲突解决”。我正在使用 NLTK 库来处理这些数据。我想知道 nltk 中哪个分类器更适合这个特定的多类分类问题。

我打算使用朴素贝叶斯分类,是否可取?

最佳答案

朴素贝叶斯是最简单易懂的分类器,因此它很好用。使用波束搜索找到最佳分类的决策树并不难理解,而且通常会更好一些。 MaxEnt 和 SVM 往往更复杂,SVM 需要进行一些调整才能正确。

最重要的是功能的选择+您提供的数据量/质量!

对于您的问题,我将首先专注于确保您拥有良好的训练/测试数据集并选择良好的功能。由于您问这个问题,您对 NLP 的机器学习没有太多经验,所以我会说朴素贝叶斯从简单开始,因为它不使用复杂的特征 - 您可以标记和计算单词出现次数。

编辑:
问题How do you find the subject of a sentence?我的回答也值得一看。

关于nlp - 在NLTK中选择哪个分类器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6585728/

相关文章:

python - 如何在 NLTK 中实现按 fileids 排序的类型标记比字典?

Javascript 动词检测

machine-learning - 如何根据标签对用户进行聚类

再现 Fisher 线性判别图

python - 如何从依赖解析器的输出制作一棵树?

nlp - 如何从互联网上获得简短自然的答案?

nlp - 使用(NLP)门工具命名实体

python - 当目标是一个热编码时,随机森林预测任一类

Python:将变量传递给 NLTK 中的 Wordnet Synsets 方法

运行 NLTK StanfordParser 时 Java 命令失败