我目前正在开发一个项目,我正在接收电子邮件,使用电子邮件包剥离消息正文,然后我想使用体育、政治、技术等标签对它们进行分类...我已经成功地从我的电子邮件中删除了邮件正文。我想开始分类。
要制作体育、技术、政治、娱乐等多个标签,我需要为每个标签使用一组单词来制作标签。示例
体育标签会有标签数据:Football、Soccer、Hockey……
在哪里可以找到可以帮助我的在线标签数据?
最佳答案
您可以使用DMOZ 。
获奖吧,有不同种类的文字。例如,电子邮件文本中最常见的单词之一是 Hi
或 Hello
,但在 wiki 文本中 Hi
和 Hello
不会是常用词
关于nlp - 标记文本文档 - 监督机器学习,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45124854/