Solr 英语同义词标准列表

标签 solr lucene

我想要的是,如果我用英语搜索“车辆”和其他此类同义词,包含“汽车”的结果也会显示出来。

我知道Solr有SynonymFilterFactory,默认情况下它是空的。但我很好奇是否有一种标准方法可以标准化英语的所有单词。我应该从同义词库生成 synonyms.txt 吗?

这是标准做法还是有更好的方法来处理这个问题?

最佳答案

看一下 WordNet。这是一个标准的英语同义词库包。它包含在 Python 的 NLTK 包中,编写一个以 SynonymFilterFactory 所需的格式转储它的脚本应该不需要做很多工作。

但就 @jay 的观点而言,您将获得很多您可能不想要的点击。花一些时间根据您的域自定义同义词库将会带来返回!

关于Solr 英语同义词标准列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39613447/

相关文章:

solr - 如何在solr中的固定位置对某些项目实现自定义排序顺序?

solr - Sunspot Solr 访问搜索结果中的非存储属性字段

java - 如何将 Solr max 函数应用于所有字段

elasticsearch - 如何索引html内容,保持位置(如xpath,css选择器等)

lucene - 在 Hadoop 上运行 Lucene/Solr 的最佳方式是什么?

使用现有字段进行 solr 排名

php - 在 Doctrine 2 中使用类表继承时 : how can one write a Native SQL Query that will return results from a child class?

java - 如何在 Hibernate 搜索中索引一组 UUID?

Solr - _version_ 字段必须存在于架构中并且可搜索

java - 在 Lucene IndexSearcher 中查询所有结果