我的项目需要一些自然语言处理。我对这个领域完全陌生。
我想要实现的是,当用户输入我在数据库中查找的产品描述时,哪个描述最接近并建议类别、产品组和子组(产品树) .
对于此标题,每个子组提取 250 个产品。
NLP 中执行此操作的具体术语是什么?我尝试用谷歌搜索一段时间,但没有成功,因为我不知道这个词。有什么好的入门教程吗?有没有好的库可以完成这项特定任务?
谢谢。
最佳答案
据我所知,自动完成或文本预测/预测搜索并不是 NLP 中真正的大研究领域。我的任何研究生类(class)都没有涉及它,但我在这个领域进行研究。我认为原因是存在足以解决绝大多数现实世界问题的解决方案。
我不确定你使用哪种语言,但如果你正在处理 java,你想要使用的库可能是 Lucene,如果这是通用的,也许设置一个 Solr 实例你面临的问题是,你正在处理大量的本体。
您可以在此处找到有关堆栈溢出的一些原因教程/示例,例如: How to implements auto suggest using Lucene's new AnalyzingInfixSuggester API?
关于使用自然语言自动完成,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34496972/