我有由以下内容组成的文章列表: 标题、副标题和正文。
现在我需要解析所有这些文章,并根据其可能的关键字将它们分组到不同的上下文类别或子类别下。
<小时/>e.g. if the article is likely to be related to sports cars then the article would be associated with the car or/and vehicle context
现在我明白了这是一片汪洋大海,但这也是我提出这个问题的原因。因为解决方案的海洋对我来说可能太大了,我很可能会迷失方向并采用一些糟糕的思想解决方案。
可能有一些我不知道的流行且标准化的方法可以做到这一点,如果有人为我指出正确的方向,那将非常有用。
有帮助就太好了。 =)
最佳答案
Natural Lanugage Toolkit但不要指望那里有一颗 Elixir ,让你不得不学习一些语言学知识,因为你描述的问题不能完全机械地解决。
关于python - 您将如何按上下文对文章进行分组? - 自然语言,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3378908/