solr - 没有位置和偏移索引的lucene短语如何工作?

标签 solr lucene full-text-search phrase

Lucene允许您使用位置和偏移量为术语建立索引,但是即使没有索引,也可以使用词组搜索。那么在没有这些信息的情况下,lucene如何计算索引中的单词顺序?

最佳答案

也许您将termvectors的位置/偏移与倒排的索引混淆了。

术语向量不用于搜索。

要将邻近信息排除在实际的过帐列表中,请使用IndexOptions.DOCS_ONLY或IndexOptions.DOCS_AND_FREQS。如果这样做,PhraseQueries将无法工作。

但是,如果您愿意接受一些不准确的地方,这些设置可以与word-ngram(带状滤波器)结合使用,以获得快速的短语“近似” ...,当然,它们对于不存在邻近性的字段也很有用适用:例如数字字段,唯一ID字段等。

关于solr - 没有位置和偏移索引的lucene短语如何工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9672165/

相关文章:

Solr 的地理空间格式器不起作用?

java - 如何在lucene中查询2个索引字段?

search - 在 Elasticsearch 中索引地理空间会导致错误?

ruby-on-rails-3 - Postgres 全文与 Rails 3 中的部分单词不匹配?

javascript - Angular.js 和服务器端搜索 - 如何,最佳实践

web-applications - 确保生产环境中的 Apache Solr 安全

java - 由于初始化失败,SolrCore 'collection1' 不可用。编辑文件并授予权限后

java - Apache Solr - 为什么分片索引的结果分数与非分片索引的结果分数不同?

search - 为什么大约 1M 文档的搜索性能很慢 - 如何扩展应用程序?

solr - 如何排除 SOLR 查询中的字段