database - 数据仓库和大数据之间的实际区别是什么?

标签 database bigdata data-warehouse

我知道什么是数据仓库以及什么是大数据。
但我对数据仓库与大数据感到困惑。
两者都具有不同的名称或两者都不同(概念和物理上)。

最佳答案

我知道这是一个较旧的线程,但在过去一年左右的时间里有了一些发展。将数据仓库与 Hadoop 进行比较就像将苹果与橘子进行比较。数据仓库是一个概念:干净、集成的高质量数据。我认为对数据仓库的需求不会很快消失。另一方面,Hadoop 是一种技术。它是一种处理大量数据的分布式计算框架。过去,数据仓库通常建立在关系数据库和数据仓库设备上。然而,在过去几年中,RDBMS 出现了各种限制(面对不断增长的数据量,许可证成本呈爆炸式增长,不适合查询图形和层次结构以及摄取非结构化数据类型等)。与此同时,Hadoop 上的 MPP SQL 查询引擎已经出现,例如 Apache Drill,现在可以查询位于 Hadoop 上的数据。

如果您对所有细节感兴趣,我已经写了关于该主题的一系列帖子。 Data Warehousing in the age of big data. The end of an era?

关于database - 数据仓库和大数据之间的实际区别是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19043747/

相关文章:

database - 设计一个存储过程,用于在 win7 上的 Aginity Workbench 4.3 中运行 Netezza 数据库中的某些功能

hadoop - 如何比较大数据中的复制

java - Hive:无法为 HDFS 中的现有数据创建外部表

sql - 如何使用 ANSI SQL 为一个简单的数据仓库编写这两个查询?

java - 有人关心用数据库解释 "Tokenized Field"吗?

php - MYSQL, PHP 插入到数据库中的多个表

android - 如何将我的数据库加载到我的网站以在我的 Android 应用程序中使用?

hadoop - 如何进行名称节点备份

count - 仓库: Store (and count) non-fact records?

mysql - 在 Kettle 上使用多个数据库连接运行相同的转换