lucene - 将lucene索引分成两半

标签 lucene

将现有 Lucene 索引拆分为两半的最佳方法是什么,即每个拆分应包含原始索引中文档总数的一半

最佳答案

拆分现有索引(无需重新索引所有文档)的最简单方法是:

  1. 制作现有索引的另一个副本(即 cp -r myindex mycopy)
  2. 打开第一个索引,删除一半文档(范围0到maxDoc/2)
  3. 打开第二个索引,删除另一半(范围从maxDoc/2到maxDoc)
  4. 优化两个指数

这可能不是最有效的方法,但它只需要很少的编码。

关于lucene - 将lucene索引分成两半,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2865960/

相关文章:

elasticsearch - Elasticsearch:统计信息和集群API中的分片数量不一致

lucene - Lucene 3 上的 "tokens"列表

python - 在 python Elasticsearch 中滚动不起作用

java - 如何在 Lucene 5.3.x 中使用 BooleanQuery 构建器?

java - 错误: java. lang.NoSuchFieldError:LUCENE_5_2_1

search - JAVA - Lucene 搜索查询 - 带通配符的连字符

playframework - 在play框架中集成Lucene

java - Lucene 4.0 中的文本搜索

java - 如何为 Lucene 8.2 编写 IP 地址正则表达式查询?

java - 如何使用 Solrj 获取 SolrDocument 的 Lucene 解释?