python - 在 Python 中加载大型 JSON 列表的最佳方式是什么?

标签 python json large-files

<分区>

我可以访问一组文件(每个大约 80-800 MB)。不幸的是,每个文件中只有一行。该行只包含一个 JSON 对象(列表的列表)。将其加载并解析为更小的 JSON 对象的最佳方式是什么?

最佳答案

pandas 0.21.0 模块现在支持 chunksize 作为 read_json 的一部分。您可以一次加载和操作一个 block :

import pandas as pd
chunks = pd.read_json(file, lines=True, chunksize = 100)
for c in chunks:
    print(c)

关于python - 在 Python 中加载大型 JSON 列表的最佳方式是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10238340/

相关文章:

Python:如何快速搜索集合中的子字符串?

ruby - libxml 将重音字符转换为反斜杠 x 转义符。杰森不开心

python - 在不知道模式的情况下加载非常大的 JSON 文件?

c# - 在 .NET 中如何最好地使用 XPath 处理非常大的 XML 文件?

php上传大文件

python - 返回包含特定元素的元组的最干净方法?

python - 如何防止向 ThreadPoolExecutor 提交过多作业?

Python shutil.copy 在 FAT 文件系统 (Ubuntu) 上失败

javascript - 使用 jQuery 按值属性对选择选项进行排序

javascript - 我可以将这些数据转换为json并使用表单POST而不是ajax发送吗