将现有 Lucene 索引拆分为两半的最佳方法是什么,即每个拆分应包含原始索引中文档总数的一半
最佳答案
拆分现有索引(无需重新索引所有文档)的最简单方法是:
- 制作现有索引的另一个副本(即 cp -r myindex mycopy)
- 打开第一个索引,删除一半文档(范围0到maxDoc/2)
- 打开第二个索引,删除另一半(范围从maxDoc/2到maxDoc)
- 优化两个指数
这可能不是最有效的方法,但它只需要很少的编码。
关于lucene - 将lucene索引分成两半,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2865960/