python - 如何将 JSON 转换为 CSV? (支持 UTF-8)

标签 python python-2.7 utf-8

之前有一个问题How can I convert JSON to CSV?并且有很多答案,但是没有一个解释如何转换非 latin1 数据。

假设我有一个如下所示的 JSON 文件:

[
    {"id":123,"FullName":"Иванов Иван Иванович"},
    {"id":124,"FullName":"Петров Петр Петрович"}
]

我尝试使用这样的脚本:

#!/usr/bin/env python2.7
# -*- coding: utf-8 -*-

import sys
import codecs
import json
import unicodecsv as csv

if __name__ == '__main__':
    fin = codecs.open(sys.argv[1], encoding='utf-8')
    data = json.load(fin)
    fin.close()

    with codecs.open('test.csv', encoding='utf-8', mode='wb') as csv_file:
        w = csv.writer(csv_file, encoding='utf-8')
        w.writerow(data[0].keys())  # header row
    
        for row in data:
            w.writerow(row.values())

这给了我以下错误:

UnicodeDecodeError: 'ascii' codec can't decode byte 0xd0 in position 32: ordinal not in range(128)

首先不清楚位置 32 是什么,但最有趣的问题是是否有办法将 UTF-8 编码的字符串保存到 CSV 文件。

最佳答案

给定 test.json (带引号和逗号,如评论中所示):

[
    {"id":123,"FullName":"Иванов, \"Иван\" Иванович"},
    {"id":124,"FullName":"Петров Петр Петрович"}
]

这有效:

#!/usr/bin/env python2.7

import json
import unicodecsv as csv

with open('test.json','rb') as fin:
    data = json.load(fin)

with open('test.csv','wb') as csv_file:
    w = csv.writer(csv_file, encoding='utf-8-sig')
    w.writerow(data[0].keys())  # header row
    for row in data:
        w.writerow(row.values())

json 模块采用 UTF-8 编码。

unicodecsv 获取以二进制模式打开的文件,并使用实例化 writer 时指定的编码进行解码。

如果 .CSV 将在 Excel 中打开,则使用 utf-8-sig,否则使用 utf8

输出:

FullName,id
"Иванов, ""Иван"" Иванович",123
Петров Петр Петрович,124

在 Excel 中:

Excel display

关于python - 如何将 JSON 转换为 CSV? (支持 UTF-8),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53972668/

相关文章:

python - 缺少 mysql.sock;产生 OperationalError : (2002, "Can' t 通过套接字 '/tmp/mysql.sock' (2)"连接到本地 MySQL 服务器"

python - 如何在keras批量更新期间缩放梯度?

java - 从UTF8获取语言

r - 带有 utf-8 文本的脚本与 Windows 中的 RStudio 和命令行的运行方式不同

python - 使用 host.get(groupids) 时 Zabbix API 返回错误值

python - 装饰器不改变 dir()

python - Python 中的多线程 : Getting stuck at last thread

python - 如何打印 float 的全精度 [Python]

Java用UTF-8字符编码字符串中的特殊字符

python - 如何制作正则表达式 'greedy but optional'