我计划使用 ElasticSearch 为我的 Cassandra 数据库编制索引。我想知道是否有人看到 ElasticSearch 的实际限制。 PB 级的速度会变慢吗?另外,有没有人在使用 ElasticSearch 索引 Cassandra 时遇到任何问题?
最佳答案
参见 this thread从 2011 年开始,它提到 ElasticSearch 配置有 1700 个分片,每个分片 200GB,这将在 1/3 PB 范围内。我希望 ElasticSearch 的架构能够支持几乎无限的水平可扩展性,因为每个分片索引都独立于所有其他分片工作。
实际限制(也适用于任何其他解决方案)包括首先实际加载那么多数据所需的时间。管理这种规模的 Cassandra 集群(或任何其他分布式数据存储)也将涉及大量维护、负载平衡等工作量。
关于cassandra - ElasticSearch + Cassandra 的实用限制,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6359382/