nlp - 如何在 NLP 中找到相似的名词短语?

标签 nlp text-classification synonym named-entity-recognition pattern-synonyms

有没有办法识别相似的名词短语。有些人建议使用基于模式的方法,例如 X as Y 表达式:

Usain Bolt as Sprint King

Liverpool as Reds

最佳答案

有很多技术可以为给定的实体找到替代名称, 使用以下模式:

  • X 也称为 Y
  • X 也命名为 Y

扫描大量文档(例如,维基百科或新闻论文文章)是一种方法。

还有其他替代方案,我记得的一个是使用维基百科内部链接结构,例如,通过探索文章之间的重定向链接。您可以从此处下载包含重定向列表的文件:https://wiki.dbpedia.org/Downloads2015-04并浏览文件,您可以找到实体的替代名称/同义词,例如:

  • Kennedy_Centre -> John_F._Kennedy_Center_for_the_Performing_Arts>
  • Lord_Alton_of_Liverpool -> David_Alton,_Baron_Alton_of_Liverpool
  • Indiana_jones_2 -> Indiana_Jones_and_the_Temple_of_Doom

您可以做的另一件事是将这两种技术结合起来,例如,查找 Indiana JonesIndiana_Jones_and_the_Temple_of_Doom 出现并且相距不超过的文本段,比方说,4 或 5 个代币。您可能会发现类似 also titled as 的模式,然后您可以使用这些模式来查找更多同义词/替代名称。

关于nlp - 如何在 NLP 中找到相似的名词短语?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53025861/

相关文章:

statistics - 给定一个文档,选择一个相关的片段

python - 如何使用双向RNN和pytorch填补空白?

nlp - 拥抱脸 pytorch 变压器 : how to initialize embeddings with certain values?

java - OpenNLP-文档分类器-如何根据状态对文档进行分类;文档语言不是英语,也是默认功能吗?

machine-learning - 使用朴素贝叶斯预测分类并处理不在训练集中的特征/单词

python - 大数据训练分类器

oracle - 创建同义词 ora-01031 权限不足

java - 使用斯坦福 CoreNLP/NER 提取标题(书籍、文章等)?

nlp - Wordnet 查找同义词

solr - 如何使 solr 同义词起作用