python - 标记数据时出错。 C 错误 : out of memory pandas python, 大文件 csv

我有一个 3.5 go 的大 csv 文件，我想使用 pandas 读取它。

这是我的代码:

import pandas as pd
tp = pd.read_csv('train_2011_2012_2013.csv', sep=';', iterator=True, chunksize=20000000, low_memory = False)
df = pd.concat(tp, ignore_index=True)

我收到此错误:

pandas/parser.pyx in pandas.parser.TextReader.read (pandas/parser.c:8771)()

pandas/parser.pyx in pandas.parser.TextReader._read_rows (pandas/parser.c:9731)()

pandas/parser.pyx in pandas.parser.TextReader._tokenize_rows (pandas/parser.c:9602)()

pandas/parser.pyx in pandas.parser.raise_parser_error (pandas/parser.c:23325)()

CParserError: Error tokenizing data. C error: out of

我的 ram 的容量是 8 Go。

最佳答案

试试这个兄弟:

mylist = []

for chunk in  pd.read_csv('train_2011_2012_2013.csv', sep=';', chunksize=20000):
    mylist.append(chunk)

big_data = pd.concat(mylist, axis= 0)
del mylist

关于python - 标记数据时出错。 C 错误 : out of memory pandas python, 大文件 csv，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41303246/

上一篇：c++ - 复制期间的字节交换

下一篇：caching - 为什么没有与缓存线大小一样宽的数据总线？

python - 根据另一列的多个条件修改一列值

python - Pytest 没有在终端中提供正确的输出

php - 输出到 CSV 需要 Forever 数百万条记录 - PHP - Mysql

python - 使用Python从邮件附件中一次性提取ZIP文件中的CSV文件

javascript - 如何使用NODE js/html在网页中显示上传的文本文件

python - Pandas - 多数据框多列条件检查和分配

python - 如何从 DataFrame 列中的对象属性创建列表？

python - 使用 pandas 绘图时，图例仅显示一个标签

python - 在 Python 中通过 TCP 套接字发送 gzip 压缩数据