django - 数据仓库和 Django

标签 django postgresql data-warehouse

与其说这是一个技术问题本身,不如说这是一个架构问题。

我目前正在构建一个商业网站/社交网络,需要存储大量数据并使用这些数据进行分析(消费者行为)。

我正在使用 Django 和 PostgreSQL 数据库。

现在我的问题是:我想扩展这个架构以包含一个数据仓库。理想情况是:操作数据库是当前的 Django PostgreSQL 数据库,数据仓库是附加的东西,最好是在多维模型中。

我们仍处于非常早期的阶段,我们将对 50 名用户进行测试,因此对于初学者来说,一些原始的东西(例如单列表)就足够了。

我想知道是否有人在这种情况下有经验,可以向我推荐一个框架来创建数据仓库,同时使用 Django 模型维护操作数据库以便于使用(如果可能)。

提前致谢!

最佳答案

这是我最近使用的一些很酷的开源工具:

  • Kettle - 很棒的 ETL 工具,您可以使用它从您的操作数据库中提取数据到您的仓库中。支持带有 JDBC 驱动程序的任何数据库,并使其非常容易构建,例如星型模式。
  • Saiku - 漂亮的 Web 2.0 前端构建于 Pentaho Mondrian (MDX 实现)。这允许您的用户轻松构建复杂的聚合查询(想想 Excel 中的数据透视表),并且 Mondrian 层提供缓存等以加快速度。尝试 the demo在这里。

关于django - 数据仓库和 Django,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10091291/

相关文章:

php - 在mysql中生成时间维度

database - 填充报告/数据仓库数据库的策略

django - 呈现文件夹和文件树的 Django 方法是什么?

python - Django ORM 查询无法选择新对象

java - 开放式 postgres : No suitable driver on tomcat

Postgresql缓存(内存)性能+缓存如何预热

postgresql - pgbouncer 无法连接到本地 postgresql 数据库(超时)

python - 通过多个博客标签索引或过滤 Wagtail 博客文章

python - 如何设置 Django 应用程序的基本 URL?

sql - 您能否推荐 Teradata 最佳实践的良好来源?