Lucene允许您使用位置和偏移量为术语建立索引,但是即使没有索引,也可以使用词组搜索。那么在没有这些信息的情况下,lucene如何计算索引中的单词顺序?
最佳答案
也许您将termvectors的位置/偏移与倒排的索引混淆了。
术语向量不用于搜索。
要将邻近信息排除在实际的过帐列表中,请使用IndexOptions.DOCS_ONLY或IndexOptions.DOCS_AND_FREQS。如果这样做,PhraseQueries将无法工作。
但是,如果您愿意接受一些不准确的地方,这些设置可以与word-ngram(带状滤波器)结合使用,以获得快速的短语“近似” ...,当然,它们对于不存在邻近性的字段也很有用适用:例如数字字段,唯一ID字段等。
关于solr - 没有位置和偏移索引的lucene短语如何工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9672165/