python - 您将如何按上下文对文章进行分组? - 自然语言

标签 python data-mining nlp

我有由以下内容组成的文章列表: 标题、副标题和正文。

现在我需要解析所有这些文章,并根据其可能的关键字将它们分组到不同的上下文类别或子类别下。

e.g. if the article is likely to be related to sports cars then the article would be associated with the car or/and vehicle context

<小时/>

现在我明白了这是一片汪洋大海,但这也是我提出这个问题的原因。因为解决方案的海洋对我来说可能太大了,我很可能会迷失方向并采用一些糟糕的思想解决方案。

可能有一些我不知道的流行且标准化的方法可以做到这一点,如果有人为我指出正确的方向,那将非常有用。

有帮助就太好了。 =)

最佳答案

Natural Lanugage Toolkit但不要指望那里有一颗 Elixir ,让你不得不学习一些语言学知识,因为你描述的问题不能完全机械地解决。

关于python - 您将如何按上下文对文章进行分组? - 自然语言,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3378908/

相关文章:

python - Python 中的照应解析

r - NLP - 在 R 中识别和替换单词(同义词)

algorithm - FP-Growth 算法的时空复杂度是多少?

Hadoop 初学者

python - Spacy - nlp.pipe() 返回生成器

python - 如何检查图像的 channel 顺序?

database - 大型数据库上的文本挖掘(数据挖掘)

python - 如何禁用 Jupyter 笔记本 session 的密码请求?

python - Python Wave音频采样率

python - 窗口中的 Blender 2.6 控制台