machine-learning - NLP 文本标记

标签 machine-learning nlp

我是 NLP 新手,第一次接触。 我正在尝试解决一个问题。

我的问题是我有一些手动标记的文档,例如:

doc1 - categoryA, categoryB
doc2 - categoryA, categoryC
doc3 - categoryE, categoryF, categoryG
.
.
.
.
docN - categoryX

这里我有一组固定的类别,任何文档都可以有任意数量的与其关联的标签。 我想使用这个输入来训练分类器,以便这个标记过程可以自动化。

谢谢

最佳答案

您尝试做的事情称为多路监督文本分类(或分类)。知道要问正确的问题就解决了一半问题。

至于如何做到这一点,这里有两个引用:

关于machine-learning - NLP 文本标记,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9000385/

相关文章:

machine-learning - 更多训练数据减少方差

machine-learning - 决策树与逻辑回归相结合

matlab - 从混淆矩阵计算灵敏度和特异性

python - 用于股市预测的情绪词典

nlp - 短文本分类

python - 如何修复 `tensorflow` 中的准确度函数?

python - 我如何在 scikit-learn 中使用 k 折交叉验证来获得每折的精确召回率?

machine-learning - Mallet 中 csvIterator 的参数是什么意思?

python - Python差异中的潜在语义分析

nlp - 如何确定一段文字是否提到了一个产品