我想要的是,如果我用英语搜索“车辆”和其他此类同义词,包含“汽车”的结果也会显示出来。
我知道Solr有SynonymFilterFactory,默认情况下它是空的。但我很好奇是否有一种标准方法可以标准化英语的所有单词。我应该从同义词库生成 synonyms.txt 吗?
这是标准做法还是有更好的方法来处理这个问题?
最佳答案
看一下 WordNet。这是一个标准的英语同义词库包。它包含在 Python 的 NLTK 包中,编写一个以 SynonymFilterFactory 所需的格式转储它的脚本应该不需要做很多工作。
但就 @jay 的观点而言,您将获得很多您可能不想要的点击。花一些时间根据您的域自定义同义词库将会带来返回!
关于Solr 英语同义词标准列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39613447/