我目前正在从事一个 NLP 项目,该项目试图在上下文中区分同义词(从 Python 的 NLTK 和 WordNet 接收)。我研究了大量 NLP 概念,试图准确找到我想要的东西,我发现的最接近的东西是 n-gram,但它并不完全适合。
假设我正在尝试找到动词“盒子”的正确定义。 “盒子”可以表示“打架”或“打包”;然而,在文本的其他地方,出现了“ring”或“fighter”这个词。据我了解,n-gram 将是“box fighter”或“box ring”,这作为一个短语相当荒谬,而且不太可能出现。但是在概念图上,“框” Action 可能与“环”相关联,因为它们在概念上是相关的。
n-gram 是我想要的吗?这个有别的名字吗?关于在哪里寻找检索此类关系数据的任何帮助?
感谢所有帮助。
最佳答案
您可能想查看词义消歧 (WSD)
,它是确定某个词的哪个“义”(意义)被特定词的使用激活的问题上下文,一个在人们中似乎很大程度上是无意识的过程。
关于python - 自然语言处理——类似于 ngram,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14718543/