python - PANDAS:int32溢出?无法建立枢纽分析表

标签 python pandas integer-overflow

我使用 pd.pivot_table()方法通过旋转用户项事件数据来创建用户项矩阵。但是,数据帧太大,以至于我这样提示:

Unstacked DataFrame is too big, causing int32 overflow



对解决这个问题有什么建议吗?谢谢!
r_matrix = df.pivot_table(values='rating', index='userId', columns='movieId')

最佳答案

库代码内部的整数溢出无济于事。您基本上有三个选择:

  • 更改您提供给库的输入数据,这样就不会发生溢出。从某种意义上讲,您可能需要使输入变小。如果这样做没有帮助,则可能是您以错误的方式使用了库,或者遇到了库中的错误。
  • 使用不同的库(或完全不使用);您正在使用的库似乎不适合在较大的输入上运行。
  • 修改库本身的代码,以便它可以处理您的输入。这可能很难做到,但是如果您向库源代码提交拉取请求,那么很多人都会从中受益。

  • 您没有提供太多代码,所以我不能告诉您什么是最佳解决方案。

    关于python - PANDAS:int32溢出?无法建立枢纽分析表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56790261/

    相关文章:

    c++ - 在循环中的什么时候整数溢出成为未定义的行为?

    python - Django 管理员 : __str__ returned non-string (type int)

    python - 将 string.format() 应用于 Pandas DataFrame 中的行

    pandas - 第一行和当前行之间的差异,按组

    python - 如何重新采样/重新组织数据框

    python - 使用 scipy 发行版运行 RandomizedSearchCV 时出现 "OverflowError: Python int too large to convert to C long"

    python - 如何获得路径的正确大写?

    python - 将 python 上传到 Nexus 3.8 时出现问题 - 401 错误

    python - Pandas 范围日期极度减慢功能

    java - C# 和 Java longs 是否形成交换环?