我看了关于提高索引性能的网站备忘录。 这是网站 link
此链接指导我如何提高性能。但是,当我使用 elasticsearch-py 批量 python api 时,它并没有提高 elasticsearch 中的索引速度。
即使所有配置更改也不会影响批量索引性能。
我使用了并行进程或线程。每秒最大平均 30000 个索引。
我做错了什么?
主节点:1 数据节点:5包括主节点 中央处理器:英特尔(R) 至强(R) CPU E5645 @ 2.40GHz 内存:32G
ES_HEAPSIZE:10G
谢谢
最佳答案
它实际上显着提高了性能(我这边超过 50%)。您只需要禁用 refresh_interval(当您完成索引数据时再次启用它)
curl -XPUT "http://localhost:9200/$INDEX_NAME/_settings" -d '{ "index" : { "refresh_interval" : "-1" }}'
#index data......
curl -XPUT "http://localhost:9200/$INDEX_NAME/_settings" -d '{ "index" : { "refresh_interval" : "1s" }}'
关于performance - 为什么不通过在 elasticsearch 中设置刷新间隔来提高性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19486348/