ssis - 数据集市与立方体

标签 ssis ssas data-warehouse cube datamart

我对仓储过程感到困惑...我正在构建数据集市,但我真正理解的部分与多维数据集有关。我读过一些有关 SSAS 的教程,但我不知道如何在其他应用程序中使用这些数据。我需要的是以下内容:

  • 包含分析所需的所有数据(深入和聚合数据,例如每日收入和年初至今收入)的仓库(数据集市)
  • 一个 .NET Web 服务,可以获取此数据,以便许多不同的应用程序可以使用它

我不明白的部分是立方体。我看到很多人使用SSAS来构建多维数据集。 SSAS 中的这些立方体是什么?它们是物体吗?它们是存储数据的表吗?我的 Web 服务如何访问多维数据集的数据?

是否有 SSAS 的替代方案?仅在数据集市中构建多维数据集并在 ETL 过程中加载它们是否可行?

最佳答案

多维数据集是预先聚合的数据存储,其格式使报告比关系数据库存储中的报告效率更高。在 SSAS 中,您可以选择多种数据最终存储方式,但通常它们存储在操作系统文件系统的文件中。它们可以像 SQL 一样进行查询(使用称为 MDX 的专门查询语言),也可以根据您的版本级别通过其他几种方法进行查询。您可以使用 Microsoft 提供的相应驱动程序为您的 Web 服务设置与数据的连接。我不确定你所说的数据集市是什么意思。您指的是星型模式格式的关系表吗?如果是这样,那么这些通常是实际立方体的前身。从报告的角度来看,使用这些关系源不会像从多维数据集获得那么多好处(因为多维数据集将每个节点(或元组)的聚合存储在星型模式表定义的维度空间内)。 ,如果我有一个关系存储(即使是星型模式格式)并且我想获取特定日期特定位置的销售额,我必须针对非常大的销售事实表运行查询并连接位置和日期维度表(也可能非常大)。如果我想要来自多维数据集的相同数据,我可以定义多维数据集过滤器,数据仓库查询会从数据中提取单个元组并更快地返回它。

SSAS 有很多替代方案,但如果您使用数据仓库,则每种方案都将是立方体的形式。如果您有一个大型数据集,则正确设计的多维数据集在多维查询方面的性能将优于关系数据集市。

关于ssis - 数据集市与立方体,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7915631/

相关文章:

sql-server - 为什么 NULL 值在事实表中映射为 0?

database - 使用SSIS整合两个数据库之间的数据

etl - 更改数据捕获多个表以进行增量加载 - ETL

sql-server-2008 - 在SSIS数据流任务中使用动态命名表

visual-studio-2012 - 每次执行一行时都会出现 "Loading Symbols"消息

sql-server - SSIS 获取连接失败。连接可能未正确配置,或者您可能对此连接没有正确的权限

sql - SSIS 查找转换未捕获不匹配的值

sql - MDX YTD 计算度量

mysql - SSAS::MDX::Scope 函数::汇率

deployment - 跨多个环境部署时的 SSAS 连接字符串?