我是 NLP 新手,第一次接触。 我正在尝试解决一个问题。
我的问题是我有一些手动标记的文档,例如:
doc1 - categoryA, categoryB
doc2 - categoryA, categoryC
doc3 - categoryE, categoryF, categoryG
.
.
.
.
docN - categoryX
这里我有一组固定的类别,任何文档都可以有任意数量的与其关联的标签。 我想使用这个输入来训练分类器,以便这个标记过程可以自动化。
谢谢
最佳答案
您尝试做的事情称为多路监督文本分类(或分类)。知道要问正确的问题就解决了一半问题。
至于如何做到这一点,这里有两个引用:
关于machine-learning - NLP 文本标记,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9000385/