python - Pandas 内存错误

我有一个包含约 50,000 行和 300 列的 csv 文件。执行以下操作会导致 Pandas (python) 中出现内存错误:

merged_df.stack(0).reset_index(1)

数据框看起来像:

GRID_WISE_MW1   Col0    Col1    Col2 .... Col300
7228260         1444    1819    2042
7228261         1444    1819    2042

我使用的是最新的 pandas (0.13.1)，该错误不会出现在行数较少的数据帧 (~2,000)

谢谢!

最佳答案

所以它占用了我的 64 位 Linux (32GB) 内存，略小于 2GB。

In [5]: def f():
       df = DataFrame(np.random.randn(50000,300))
       df.stack().reset_index(1)


In [6]: %memit f()
maximum of 1: 1791.054688 MB per loop

因为你没有指定。这在 32 位上根本不起作用(因为您通常不能分配 2GB 的连续 block )，但如果您有合理的交换/内存，应该可以工作。

关于python - Pandas 内存错误，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23205005/

上一篇：python - while循环不会在python中停止

下一篇：python - ponyORM:查询有问题

相关文章：

python - 日期之间的差异 - 整数结果

python - 日期与时间图上数据的颜色映射

python - 漂亮的嵌套字典作为表格

python - 如何使用python中的子进程将两个值传递给stdin

python - python 解析器如何包含 "AT"文件(ini)

c - printf 是如何工作的？

c - Unix/C : put a file into shared memory

c# - 将泛型 Span<T> 转换为特定实例化(例如 Span<int>)(如果它在运行时实际上属于该类型)

python - 用django控制python程序

Python。 Pandas 。大数据。凌乱的 TSV 文件。如何争论数据？