python - 包含 json 格式列的 Dask 数据框

标签 python pandas dask

我有一个包含 json 格式列的 dask 数据框,我想将该列解析为数据框格式。

json 格式的列如下所示:

{"名称": {"id": 1000, "地址": "ABC", ....}},,,

所以我只想提取“名称”的值,并将它们中的每个键作为一列,每个值在其中一个值,如:

id    address ...
1000  ABC
2000  DEF
3000  GHA
...   ...

我认为我们可以通过 read_json 将 json 文件读入 dask dataframe,但我该怎么做呢?

最佳答案

您正在执行的操作似乎并行得令人尴尬。因此,您可以编写一个 Pandas 函数,然后将该函数并行应用于 dask 数据帧。

def f(df: pandas.DataFrame) -> pandas.DataFrame:
    ... however you would do this in Pandas

ddf = ddf.map_partitions(f)

关于python - 包含 json 格式列的 Dask 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61787813/

相关文章:

python - 我与 Python 进行数值集成的错误在哪里?

python - 使用 hlines 创建甘特图?

python - 根据单行中的频率将分类变量转换为数字

python-3.x - 根据条件删除 dask dataFrame 中的行

python - 将 dask 系列连接到数据帧时出错

python - 使用 Python 的 FTP 库检索文件

python - 我用 pip install 安装的包显示没有模块

python - 在python中验证用户输入的字符串

python - 将 Excel 工作簿拆分为多个 Excel 文件

pandas - 带有日期的列进入 dask 中的日期时间索引