hadoop - 数据库基准测试 : Cassandra vs. BigTable 与 Hadoop(s)

标签 hadoop cassandra performance-testing bigtable

我希望评估使用 Cassandra、BigTable 或 Hadoop 解决方案的可能性。是否有任何地方对这三者在一组基准测试中的比较和表现进行了最新比较?我发现了一些可能是五年前的东西,但我想在深入研究之前更全面地了解这三个数据库——它们的优缺点。

最佳答案

  1. Hadoop 是一个生态系统,上面运行着多种类型的数据库。我相信你想比较的是HBase。在我见过的大多数基准测试中,Cassandra 都比较慢,您可以轻松找到用于比较这两者的基准测试。当您谈论 Hadoop 时,您需要了解这是比 Cassandra 或 BigTable 复杂得多的环境。
  2. BigTable 几乎可以吃掉你扔在上面的所有东西,只需向谷歌支付费用,一切都会好起来的。 (看到了 200 万条记录/秒写入的基准)。
  3. Cassandra 架构基于 DynamoDB(AWS) 和 BigTable 设计。在其设计的工作负载中速度非常快(您可以找到每秒 100 万次写入的许多基准)。
  4. 永远不要相信互联网上的基准 :)。您必须使用示例数据自行运行它。并非所有数据库都适合所有需求。如果您提供更多有关要对数据库施加的工作负载的信息,这里的人员可以指导您找到所需的数据库。 (比您列出的 3 个要多得多)。

关于hadoop - 数据库基准测试 : Cassandra vs. BigTable 与 Hadoop(s),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41579281/

相关文章:

hadoop - Spark中HIVE表的显示

hadoop - 从另一个包含空值的表中向表中插入数据,并将空值替换为原始表 1 的值

java - 有没有一种方法可以限制我的mapreduce(JAVA)作业产生的记录量?

performance - Hive:是否有更好的方法对列进行百分位排名?

scala - outworkers phantom 禁用为 cassandra 键空间中的某些表创建表,但不是所有表

Jenkins 在实际失败时验证 JMeter 构建成功

JavaScript:长方法名会降低程序速度吗?

hadoop - ColumnFamilyInputFormat - 无法获取输入拆分

cassandra - 删除所有数据 Cassandra?

c - AES 192、AES-256 的段错误,不适用于 AES-128 位