数据分析学习的Python包推荐

标签 python olap pandas pytables cubes

我想在文章发布平台上构建一个分析引擎。更具体地说,我想跟踪用户的阅读行为(例如文章的浏览量、文章打开时间、评分等),以及文章本身的统计数据(例如段落数、作者等) )。

这有两个目的:

  1. 展示有关用户和文章的见解
  2. 向用户提供建议

对于数据分析部分,我一直在查看cubes , pandaspytables 。数据量很大,并且存储在MySQL表中;我不确定这些包中的哪一个可以更好地处理这样的后端。

对于推荐部分,我只是考虑将数据从数据分析引擎提供给聚类模型。

关于如何将所有这些组合在一起的任何建议,以及可以帮助我的很酷的 python 项目吗? 如果我需要提供更多信息,请告诉我。

谢谢

最佳答案

Scikit-learn应该会让您对数据处理(集群)部分感到满意​​。

关于数据分析学习的Python包推荐,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12425602/

相关文章:

Python Sympy Latex Fraction 在没有先分解的情况下不会打印

python - Pandas 在另一个系列的一个系列中找到 super 字符串

python - ImportError:无法为 Google App Engine GAE Init 快速入门和教程导入名称 stub

python - USB : usb_device_handle_win. cc:1020 在 Windows10 上使用 Selenium 的 ChromeDriver v87/Chrome v87 无法从节点连接错误中读取描述符

sql-server-2008-r2 - 查询 (2, 2) 默认情况下,需要年份级别。在 cube.ytd 中找不到这样的级别 MDX 查询中的函数不起作用

database - 任何可扩展的 OLAP 数据库(网络应用程序规模)?

ssas - 如何获取 SSAS 多维数据集维度和维度属性的列表

python - 使用python只读excel中的可见行

python - 加入多索引的pandas系列

python - 对多列进行分组并过滤并拆分为单独的数据帧