使用自然语言自动完成

我的项目需要一些自然语言处理。我对这个领域完全陌生。

我想要实现的是，当用户输入我在数据库中查找的产品描述时，哪个描述最接近并建议类别、产品组和子组(产品树) .

对于此标题，每个子组提取 250 个产品。

NLP 中执行此操作的具体术语是什么？我尝试用谷歌搜索一段时间，但没有成功，因为我不知道这个词。有什么好的入门教程吗？有没有好的库可以完成这项特定任务？

谢谢。

最佳答案

据我所知，自动完成或文本预测/预测搜索并不是 NLP 中真正的大研究领域。我的任何研究生类(class)都没有涉及它，但我在这个领域进行研究。我认为原因是存在足以解决绝大多数现实世界问题的解决方案。

我不确定你使用哪种语言，但如果你正在处理 java，你想要使用的库可能是 Lucene，如果这是通用的，也许设置一个 Solr 实例你面临的问题是，你正在处理大量的本体。

您可以在此处找到有关堆栈溢出的一些原因教程/示例，例如: How to implements auto suggest using Lucene's new AnalyzingInfixSuggester API?

关于使用自然语言自动完成，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34496972/

相关文章：

python - NLTK 词干产生奇怪的结果