sql-server - DataWarehouse - 什么是好的定义?

标签 sql-server data-warehouse

谁能给我一个关于什么是数据仓库的良好、实用的定义?

最佳答案

我很惊讶没有人发帖 Inmon's definition :

A warehouse is a subject-oriented, integrated, time-variant and non-volatile collection of data in support of management's decision making process

在同一页面中,您可以找到 Kimball 的定义:

A copy of transaction data specifically structured for query and analysis

不幸的是,我认为数据仓库是一个涉及面很广的领域。标准范例很少,种类繁多,特别是我在考虑 Kimball 的维度建模。 Inmon 没有像 Kimball 那样具体的方法论,因此一些 3NF 模型可能符合也可能不符合他的原则。

由于 Inmon 扩大了仓储的范围,它可以包含非结构化数据。然而,非结构化数据的分析与传统分析有很大不同。

应用于 SQL Server 时,通常 SQL Server 上最大的数据仓库是按维度建模的,因为这很适合非分布式、非大规模并行模型。像 Teradata 这样的大规模并行系统通常在 3NF 模型上表现得更好。这些仍然是基于表的系统,各种表与外键约束相连(可能不是强制的,但至少是合乎逻辑的)。

当然,我们也看到了像 Map/Reduce 这样的 NoSQL 数据处理系统,它们在我们已经使用了 40 年的规范化、非规范化或非规范化/不良规范化关系数据库的意义上根本不是真正的数据库。

关于sql-server - DataWarehouse - 什么是好的定义?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2878978/

相关文章:

尽管更新了统计数据,SQL Server 2016 的查询计划估计仍然不正确

Azure 数据工厂与 Azure 逻辑应用

database - Hadoop会取代ETL吗?

sql - 柱状数据库

data-warehouse - 星型模式设计中的维表有哪些类型?

sql-server - 在PowerShell中调用存储过程以插入SQL Server数据库

sql - 刚刚在同一 CTE 中创建的访问列

sql - NOT IN 子句中的 NULL 值

sql-server - 仅选择具有 NULL 值的列

大数据量的数据库选择?