之前有一个问题How can I convert JSON to CSV?并且有很多答案,但是没有一个解释如何转换非 latin1 数据。
假设我有一个如下所示的 JSON 文件:
[
{"id":123,"FullName":"Иванов Иван Иванович"},
{"id":124,"FullName":"Петров Петр Петрович"}
]
我尝试使用这样的脚本:
#!/usr/bin/env python2.7
# -*- coding: utf-8 -*-
import sys
import codecs
import json
import unicodecsv as csv
if __name__ == '__main__':
fin = codecs.open(sys.argv[1], encoding='utf-8')
data = json.load(fin)
fin.close()
with codecs.open('test.csv', encoding='utf-8', mode='wb') as csv_file:
w = csv.writer(csv_file, encoding='utf-8')
w.writerow(data[0].keys()) # header row
for row in data:
w.writerow(row.values())
这给了我以下错误:
UnicodeDecodeError: 'ascii' codec can't decode byte 0xd0 in position 32: ordinal not in range(128)
首先不清楚位置 32 是什么,但最有趣的问题是是否有办法将 UTF-8 编码的字符串保存到 CSV 文件。
最佳答案
给定 test.json
(带引号和逗号,如评论中所示):
[
{"id":123,"FullName":"Иванов, \"Иван\" Иванович"},
{"id":124,"FullName":"Петров Петр Петрович"}
]
这有效:
#!/usr/bin/env python2.7
import json
import unicodecsv as csv
with open('test.json','rb') as fin:
data = json.load(fin)
with open('test.csv','wb') as csv_file:
w = csv.writer(csv_file, encoding='utf-8-sig')
w.writerow(data[0].keys()) # header row
for row in data:
w.writerow(row.values())
json
模块采用 UTF-8 编码。
unicodecsv
获取以二进制模式打开的文件,并使用实例化 writer
时指定的编码进行解码。
如果 .CSV 将在 Excel 中打开,则使用 utf-8-sig
,否则使用 utf8
。
输出:
FullName,id
"Иванов, ""Иван"" Иванович",123
Петров Петр Петрович,124
在 Excel 中:
关于python - 如何将 JSON 转换为 CSV? (支持 UTF-8),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53972668/