database - 任何可扩展的 OLAP 数据库(网络应用程序规模)?

标签 database hadoop olap hbase olap-cube

我有一个应用程序需要对不同级别的聚合进行分析,这就是 OLAP 工作负载。我也想经常更新我的数据库。

例如,这是我的更新的样子(架构看起来像:时间、目标、源 ip、浏览器 -> 访问)

(15:00-1-2-2010, www.stackoverflow.com, 128.19.1.1, safari) -->  105

(15:00-1-2-2010, www.stackoverflow.com, 128.19.2.1, firefox) --> 110

...

(15:00-1-5-2010, www.cnn.com, 128.19.5.1, firefox) --> 110

然后我想问一下上个月从 firefox 浏览器访问 www.stackoverflow.com 的总次数是多少。

我知道 Vertica 系统可以以相对便宜的方式做到这一点(性能和可扩展性方面,但可能不是成本方面的)。我有两个问题。

1) 是否有开源产品可以帮助我解决这个问题?特别是,蒙德里安系统的工作情况如何? (可扩展性和性能) 2) 是否有 HBase 或 Hypertable 基础解决方案(显然,裸 HBase/Hypertable 不能这样做)? -- 但如果有一个基于 HBase/Hypertable 的项目,可扩展性可能不会成为问题 IMO)?

谢谢!

最佳答案

您可以下载 greenplum 数据库的免费版本(单节点版本)。我自己没有尝试过,但我认为/猜测它是一种强大的野兽。在这里阅读:http://www.dbms2.com/2009/10/19/greenplum-free-single-node-edition/

另一个选择是 MongoDB,它快速且免费,您可以使用 JavaScript 编写 MapReduce 函数来进行分析。

我在这里的声誉很低,无法添加到 mongodb 的超链接,所以你必须谷歌。每个帖子我只能添加一个超链接。

关于database - 任何可扩展的 OLAP 数据库(网络应用程序规模)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2075797/

相关文章:

php - 如何将两张表的数据库数据内容复制到一张表中

mysql - 三表关联

hadoop - hsync()如何在HDFS中工作?

hadoop - 带有动态查找表的 Spark Streaming

java - HBase on Tomcat7 安装错误: Could not initialize class org. apache.hadoop.security.ShellBasedUnixGroupsMapping

api - 带有 OLTP 和 OLAP 数据库的 CQRS 有意义吗?

python - 如何从 databrewery 多维数据集中的多个存储创建 OLAP 多维数据集

java - Spring Boot - 外键 PostgreSQL 数据库中的空值

database - 从关系 OLTP 数据库到 OLAP 多维数据集的最佳方法是什么?

Java 数据库编程 - 为什么这些值不是 "equal"?