python - python 中 JSON 到 CSV 的转换问题

标签 python arrays json object csv

我正在尝试将嵌套 JSON 对象文件转换为 CSV。 这是 JSON 的示例

{
   "total_hosts" : [
      {
         "TYPE" : "AGENT",
         "COUNT" : 6
      }
   ],
   "installed" : [
      {
         "ID" : "admin-4.0",
         "VERSION" : 4,
         "ADDON_NAME" : "Administration"
      },
      {
         "ID" : "admin-2.0",
         "VERSION" : 2,
         "ADDON_NAME" : "Administration"
      },
      {
         "ID" : "ch-5.0",
         "VERSION" : "5",
         "ADDON_NAME" : "Control Host"
      }
   ],
   "virtual_machine" : [
      {
         "COUNT" : 4,
         "TYPE" : "VM"
      }

TYPE、COUNT、ID、VERSION 像这些是列,但问题不是每个对象都有值,有些有 1 个带有这些值的对象,有些有更多,我写在行中,所以我试图写空白当该列没有值时使用空格。

将其写入 CSV 的代码

json_input = open('all.json')
try:
    decoded = json.load(json_input)
# tell computer where to put CSV
    outfile_path='Path to CSV'
# open it up, the w means we will write to it
    writer = csv.writer(open(outfile_path,'w'))


       for index in range(len(decoded['installed'])):
            row = []

            if decoded['total_hosts'][index]['TYPE'] is None:
                row.append(str(''))
            else:
                row.append(str(decoded['total_hosts'][index]['TYPE']))
            if decoded['total_hosts'][index]['COUNT'] is None:
                row.append(str(''))
            else:
                row.append(str(decoded['total_hosts'][index]['COUNT']))

            writer.writerow(row)

我收到 Index out of range 错误,我什至尝试了 ifTrue/False 条件。

谁能帮我解决这个问题吗?

更新:预期输出:

TYPE,COUNT,ID,VERSION,ADDON_NAME,COUNT,TYPE
AGENT,6,admin-4.0,4,Administration,4,VM
 , ,admin-2.0,2,Administration, , 
 , ,cd-5.0,5,Control Host, , 

所以基本上当该列没有值时我需要空格。

问题修改:输出:

AGENT,6,,,
 , ,admin-4.0,4,Administration
 , ,admin-2.0,2,Administration
 , ,ch-5.0,5,Control Host

预期输出:

AGENT,6,admin-4.0,4,Administration
 , ,admin-2.0,2,Administration
 , ,ch-5.0,5,Control Host

更新:我什至尝试过

            row.append(str(entry.get('TYPE', '')))
            row.append(str(entry.get('COUNT', '')))
            row.append(str(entry.get('ID', '')))
            row.append(str(entry.get('VERSION', '')))
            row.append(str(entry.get('ADDON_NAME', '')))
            writer.writerow(row)

仍然得到与上面相同的输出。 :(

最佳答案

这里有两个错误:

  1. 您可以使用decoded['installed'] 的长度生成一个索引,然后将其用于decoded['total_hosts'] 列表。这将生成索引错误,因为 decoded['total_hosts'] 没有那么多条目。

  2. 访问不存在的 key 将抛出KeyError;使用dict.get() method而不是检索值或默认值。

直接在列表上循环要简单得多,无需生成索引:

for host in decoded['total_hosts']:
    row = [host.get('TYPE', ''), host.get('COUNT', '')]
    writer.writerow(row)

您可以扩展它来处理多个键:

for key in ('total_hosts', 'installed', 'virtual_machine'):
    for entry in decoded[key]:
        row = [entry.get('TYPE', ''), entry.get('COUNT', '')]
        writer.writerow(row)

如果您需要合并两个条目的输出,请使用 itertools.izip_longest()将列表配对,当较短的列表用完时使用默认值:

from itertools import izip_longest

for t, i, v in izip_longest(decoded['total_hosts'], decoded['installed'], decoded['version'], fillvalue={}):
    row = [t.get('TYPE', ''), t.get('COUNT', ''), 
           i('ID', ''), i('VERSION', ''), i.get('ADDON_NAME', ''),
           v.get('COUNT', ''), v.get('TYPE', '')]
    writer.writerow(row)

这允许三个列表中的任何一个比其他列表短。

对于 2.6 之前的 Python 版本(添加了 itertools.izip_longest),您必须假设 installed 始终是最长的,然后使用:

for i, installed in decoded['installed']:
    t = decoded['types'][i] if i < len(decoded['types']) else {}
    v = decoded['version'][i] if i < len(decoded['version']) else {}
    row = [t.get('TYPE', ''), t.get('COUNT', ''), 
           installed['ID'], installed['VERSION'], installed['ADDON_NAME'],
           v.get('COUNT', ''), v.get('TYPE', '')]
    writer.writerow(row)

关于python - python 中 JSON 到 CSV 的转换问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23062830/

相关文章:

python - MySQL-python,错误: command 'gcc-4.2' failed with exit status 1

java - 计算数组中递增的元素

arrays - 用中间的最大值填充二维数组的算法

java - Json动态反序列化与 jackson

python - Scala HTTPS post 包括 JSON 输入和输出以及身份验证

python - 是否有用于 Python 2.7 的 64 位二进制版本的 ujson 或 cjson

python - 在 Matplotlib/Python 中将小照片/图像添加到大图形

python - 当我将其分配给列表的第一个索引时,为什么我的值会发生变化?

java - 字节数组到 int java 在 Windows 中工作而不是在 linux 中

python - 在同一台计算机上开发和使用相同的Python