nlp - 标记文本文档 - 监督机器学习

我目前正在开发一个项目，我正在接收电子邮件，使用电子邮件包剥离消息正文，然后我想使用体育、政治、技术等标签对它们进行分类...我已经成功地从我的电子邮件中删除了邮件正文。我想开始分类。

要制作体育、技术、政治、娱乐等多个标签，我需要为每个标签使用一组单词来制作标签。示例

体育标签会有标签数据:Football、Soccer、Hockey……

在哪里可以找到可以帮助我的在线标签数据？

最佳答案

您可以使用DMOZ 。

获奖吧，有不同种类的文字。例如，电子邮件文本中最常见的单词之一是 Hi 或 Hello，但在 wiki 文本中 Hi 和 Hello 不会是常用词

关于nlp - 标记文本文档 - 监督机器学习，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45124854/