我即将开始为电子商务网站开发网络分析工具。
我将记录几个不同的事件,主要是点击页面的各种元素和页面浏览量。
这些事件携带元数据(登录用户的用户名、他的国家、他的年龄等),页面本身携带其他元数据(类别、子类别、产品等)。
我的公司想要类似 OLAP 多维数据集的东西,以便能够回答如下问题:
有多少来自国家 x 的客户访问了类别 y? 2012 年 1 月类别 x 的综合浏览量是多少? 有多少来自国家 x 的客户访问了类别 y?
我的理解是,我应该用一个OLAP引擎来记录这些事件,然后构建一个报表接口(interface)让我的同事使用。
我说的对吗?您对我应该使用的引擎和前端/报告工具有什么建议吗?我是一名 Python 程序员,所以任何对 Python 友好的东西都会很好。
谢谢!
最佳答案
主要问题是您的多维数据集有多大,以及您是否需要开源 OLAP 解决方案。
如果您正在处理大立方体并希望为 future 的功能腾出空间,您可能会选择真正的 OLAP Server .一些是开源的 - Mondrian - 和其他有“有限”社区版 - Palo , icCube .这里的重点是与 MDX 和 XMLA 兼容。事实上的 OLAP 标准,因此您可以插入不同的报告工具和/或使用现有的库。我的理解是,没有像 Java 或 .NET 中那样用于 XMLA 库的 Phyton 版本,我不确定这是要走的路。
如果你的立方体很小,你可以自己开发一些东西,或者像 Charlax 的评论所指出的那样寻求其他更快的解决方案。
关于python - 构建网络分析工具的建议(最好是 Python 友好的)- OLAP/Python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8956744/