python - 构建网络分析工具的建议(最好是 Python 友好的)- OLAP/Python

标签 python analytics olap

我即将开始为电子商务网站开发网络分析工具。

我将记录几个不同的事件,主要是点击页面的各种元素和页面浏览量。

这些事件携带元数据(登录用户的用户名、他的国家、他的年龄等),页面本身携带其他元数据(类别、子类别、产品等)。

我的公司想要类似 OLAP 多维数据集的东西,以便能够回答如下问题:

有多少来自国家 x 的客户访问了类别 y? 2012 年 1 月类别 x 的综合浏览量是多少? 有多少来自国家 x 的客户访问了类别 y?

我的理解是,我应该用一个OLAP引擎来记录这些事件,然后构建一个报表接口(interface)让我的同事使用。

我说的对吗?您对我应该使用的引擎和前端/报告工具有什么建议吗?我是一名 Python 程序员,所以任何对 Python 友好的东西都会很好。

谢谢!

最佳答案

主要问题是您的多维数据集有多大,以及您是否需要开源 OLAP 解决方案。

如果您正在处理大立方体并希望为 future 的功能腾出空间,您可能会选择真正的 OLAP Server .一些是开源的 - Mondrian - 和其他有“有限”社区版 - Palo , icCube .这里的重点是与 MDX 和 XMLA 兼容。事实上的 OLAP 标准,因此您可以插入不同的报告工具和/或使用现有的库。我的理解是,没有像 Java 或 .NET 中那样用于 XMLA 库的 Phyton 版本,我不确定这是要走的路。

如果你的立方体很小,你可以自己开发一些东西,或者像 Charlax 的评论所指出的那样寻求其他更快的解决方案。

关于python - 构建网络分析工具的建议(最好是 Python 友好的)- OLAP/Python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8956744/

相关文章:

python - PyTest 跳过 module_teardown()

python - 当多线程 python 进程运行时,操作系统开始杀死进程

python - 如何将 django admin 中输入的符号转义为 html 表示

python - 寻找加密货币数据之间的相关性

php - 处理访问日志的算法

olap - 是否存在非关系型OLAP引擎?

ms-access - 微软 Access + OLAP

python - 加入上一年的附加计算

machine-learning - 数据挖掘和机器学习之间的区别

data-mining - OLAP 和数据挖掘。如何 ?