performance - TSDB 与 HBase : What to choose in long term?

标签 performance hbase tableau-api opentsdb

我们正在努力解决的问题: 存储所有可以稍后查询的数据点以推断 Web 服务的性能。 提供数据的可视化表示。

这是我迄今为止在 Hbase 和 TSDB 网站上读到的内容的理解

  • TSDB 将数据存储在 Hbase 中,尽管采用了一些非标准的方式(宽行格式)

  • TSDB 速度极快,并且提供了快速添加图表的方法。

  • 虽然与 TSDB 相比,HBase 速度较慢,但​​您可以选择使用 SIMBA ODBC 驱动程序将其连接到 Tableau,Tableau 具有惊人的敏捷性和美观的可视化数据表示形式。

TSDB 的另一个问题是它不适用于当前的 HBase .96(我知道 tsuna@ 正在开发它,但我没有针对当前 Hbase.96 的 tsdb 稳定版本的时间表)

因此,您的简单答案可以是 Hbase 或 TSDB,或者除了选择其中之一之外,您还可以证明您的答案的合理性并帮助我选择其中之一。

如果其他解决方案能够支持一年内存储的约万亿个数据点,我愿意接受其他解决方案。

最佳答案

以我诚实的观点, 如果您需要绘制数据,您应该考虑使用 OpenTSDB。我不确定从长远来看它还能做得更好,因为 OpenTSDB 正在不断开发,并于 11 月发布了 RC 2.0 版本。 OpenTSDB 还有一个分支,名为 KairosDB它使用 Apache Cassandra作为数据库,您可以存储长达毫秒的点,而 OpenTSDB 允许您存储长达秒的点。

因此,我建议您使用 OpenTSDB/KairosDB 等时间序列分布式数据库,以非常简单的方式绘制数据。不确定长期问题,也许由于其开源性质,下个月可以在 Hbase 上开发出更好的东西。

关于performance - TSDB 与 HBase : What to choose in long term?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20446299/

相关文章:

c++ - 如何使用 openGL 获得真正平滑的移动物体

java - Hbase:数据未按照关键命名规则划分为区域

hadoop - 带有 syslogs source 和 hbase sink 的 flum agent

java - pig导入hdfs数据到hbase报错

hadoop - Hortonworks Sandbox 连接到 Tableau 时出错

tableau-api - 我们可以在 tableau 中使用循环函数吗

hadoop - 如何将Hive连接到Tableau?

performance - 最有效地在维护的大型排序变量中插入数字

android - Android 模拟器加载缓慢的原因是什么?

android - android-async-http loopj 使用的 httpclientandroidlib 很慢