elasticsearch - ElasticSearch:解释所有文档 “_size”和 “store.size_in_bytes” API端点之和之间的差异吗?

标签 elasticsearch elastic-stack

我注意到如果我对索引中所有ElasticSearch文档的_size属性进行汇总,则得到的值约为180 GB,但是如果我访问同一索引的_stats API端点,则得到所有size_in_bytesprimaries值是100 GB

根据我的理解,_size属性应该是_source字段的大小,并且索引当前存储了_source字段,因此它至少应不等于_size的总和吗?

最佳答案

_size似乎存储了源文档的实际大小。当实际将源存储在stored_fields中时,Elasticsearch将对其进行压缩(如果我没有记错的话,默认为LZ4)。因此,我希望它在磁盘上的大小小于实际大小。而且,如果源中没有任何二进制数据,则压缩率也将大大提高。

关于elasticsearch - ElasticSearch:解释所有文档 “_size”和 “store.size_in_bytes” API端点之和之间的差异吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61142976/

相关文章:

java - Jhipster Elasticsearch数据迁移

elasticsearch - 您可以在 jmeter 测试计划中指定多个休息端点吗?

elasticsearch - Logstash:值太大而无法输出

amazon-web-services - ELK 在 AWS 上的良好设置

elasticsearch - 是否可以在读写索引上使用 only_expunge_deletes 强制合并?

c# - Elasticsearch.net 客户端无法进行基本搜索

elasticsearch - 编写REST API的PUT端点的最佳实践

elasticsearch - Kibi可以与Elasticsearch 5.2一起使用吗?

elasticsearch - Logstash将不同的字段输出到不同的 Elasticsearch 索引

elasticsearch - Kibana没有显示任何来自Elasticsearch的数据