elasticsearch - 如何加快 Elasticsearch 重新索引操作?

标签 elasticsearch

我们可以通过将副本设置为零并增加刷新间隔来加速elasticsearch(v 5.3)重新索引操作吗?或者它已经在内部处理了吗?

最佳答案

为了improve indexing speed您可以使用以下内容:

  • 使用批量请求
  • 使用多个工作线程/线程将数据发送到 Elasticsearch
  • 增加刷新间隔
  • 禁用初始加载的刷新和副本
  • 使用自动生成的 ID
  • 增加索引缓冲区大小

与您的问题相关 - ElasticSearch 专为连续日志处理而设计,这就是为什么所有这些操作都不是自动的。如果进行批量重新索引,您必须手动更改所有这些设置并在最后恢复它们:

  • Lucene 索引编写器的刷新间隔
  • 分布式处理器的复制因子
  • 合并调度程序的索引缓冲区大小

关于elasticsearch - 如何加快 Elasticsearch 重新索引操作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48590502/

相关文章:

elasticsearch - 如何在 ElasticSearch 中做嵌套的 AND 和 OR 过滤器?

elasticsearch - Elasticsearch 中使用正则表达式查询的地理距离查询

Elasticsearch 7.x 断路器 - 数据过大 - 故障排除

elasticsearch - 如何连接Play!通过Ebean到ElasticSearch的框架

elasticsearch - 一个索引的 Elasticsearch 中的多个映射

docker - Elasticsearch 服务未在 gitlab 上启动 - docker 容器已在使用中

django - Elasticsearch 与 Django : Failed to establish a new connection: [Errno 111] Connection refused) caused by: NewConnectionError

docker - 错误 pipeline/output.go :100 Failed to connect to backoff(async(tcp://logstash:5044)) - ELK Filebeat . NET Core 3.1 Docker

java - Elasticsearch 更像这样的结果

docker - Docker,是否可以将主机数据复制到Docker卷?