python - 在 Google Colab 中使用 plotly 绘制超过 600 万行的数据集

标签 python plotly google-colaboratory

让我先给你一些背景。我能够导入 kaggle 比赛(m5 精度)的整个数据并且效果非常好。问题是,当我尝试使用 plotly(没有聚合)做直方图时,不会返回任何内容。但是当我使用 Sample 时,它​​会正确绘制。
一些额外的信息:

  • 我为 google colab 使用了 plotly 的渲染器。
  • 数据帧中的行数为 56M,我的样本为 10M。
  • 我运行了 matplotlib 和 seaborn 直方图,并根据所有数据成功显示了直方图。
  • 我尝试使用 6M 的较小数据帧运行直方图。发生了同样的情况,但我能够用 2M 样本进行绘图。
  • 我尝试了一个带有来自 seaborn 的提示数据框的直方图,并正确绘制了直方图。
  • 创建基于聚合的图形时,它可以完美运行。

  • 这是我的代码的链接。 https://colab.research.google.com/drive/1uMU3ctDzkGObYeCfxF36hURT9WIvnrl7?usp=sharing
    我知道这不是进行良好设计分析的限制,但我想知道是否可以使用所有可用数据以及造成此问题的原因。谢谢你阅读我。

    最佳答案

    它已经存在问题 here
    解决方案是先进行聚合,例如集合.计数器()。然后绘制一个条形图。

    关于python - 在 Google Colab 中使用 plotly 绘制超过 600 万行的数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62777776/

    相关文章:

    google-colaboratory - 将本地文件导入到 google colab

    python-ldap -- 在 Active Directory 中创建用户 -- 问题 2003 (BAD_ATT_SYNTAX) cn 和 DN

    python - protobuf 和 python : can protoc generate __init__. py 文件?

    python - 运行单个 Flask 单元测试通过但运行所有测试给出 AssertionError

    Plotly Treemap 不能与 go.Treemap 一起使用,但可以与plotly.express 一起使用吗?

    python - 在 Google Colab 中调试

    python - 在 Django 应用程序测试中使用 mock 来覆盖函数

    python - 将自定义图例(标记颜色)添加到 plotly python

    python - 是否有像 matplotlib basemap 这样的库可以在街道级别显示 map ?

    javascript - Jupyter Notebook 中的 Google Colabs eval_js?