我正在使用分面查询来自动完成。
例如:
http://localhost:8983/solr/collection1/autocomplete_en?facet.prefix=sol&...
更新处理程序配置为执行软提交:
<updateHandler class="solr.DirectUpdateHandler2">
<updateLog>
<str name="dir">${solr.ulog.dir:}</str>
</updateLog>
<autoCommit>
<maxTime>30000</maxTime>
<openSearcher>false</openSearcher>
</autoCommit>
<autoSoftCommit>
<maxTime>1000</maxTime>
</autoSoftCommit>
</updateHandler>
但是在更新索引之后,facet 查询总是很慢。
该文档说,“软提交将使文档可见,但要付出一定代价。...FieldValueCache 已失效,因此分面查询必须等到缓存刷新”
参见 http://searchhub.org/2013/08/23/understanding-transaction-logs-softcommit-and-commit-in-sorlcloud/
因此即使在软提交之后,facet 查询也总是很慢,因为必须重新计算 FieldValueCache。
具有 DocValues 的 Facets 是实时兼容的,但不幸的是不支持 TextFields。 见http://wiki.apache.org/solr/DocValues
我必须对查询使用过滤器,所以我不能使用建议组件。
我的问题:
- 还有机会使用近乎实时的分面搜索吗?
- Elasticsearch 是如何解决这个问题的?
最佳答案
更改 facet.method
可能会有所帮助。
fc
作为默认值不适合在全文字段上分面。
在我的例子中,enum
帮助:
http://localhost:8983/solr/collection1/autocomplete_en?facet.prefix=sol&facet.method=enum...
但对于较大的索引,即使 enum
也可能太慢。
如果您不需要查询过滤器,您应该考虑建议组件: http://wiki.apache.org/solr/Suggester
接近实时也是一个问题。 但在大多数用例中,优化后的更新就足够了。
关于solr - 用于自动完成的近实时 Solr Facet 查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20645299/