python - 将列表列表构建为 csv/Excel 的列和行

标签 python list pandas csv dictionary

我有这个 python3 代码,其中包含一个列表列表,我需要以某种方式为 Excel 构建这些列表。这是我所拥有的:

>>> pprint(avrop_categories[0:3])

[['Name1', ['MainCategory1', 'SubCategory1', ('Item1', 1.0)]],

['Name2',
['MainCategory2', 'Subcategory2', ('Item2', 1.0)],
['MainCategory2', 'Subcategory3', ('Item3', 1.0)],
['MainCategory2', 'Subcategory4', ('Item4', 1.0)],
['MainCategory3', 'Subcategory5', ('Item5', 1.0)],
['MainCategory4', 'Subcategory6', ('Item6', 1.0)],
['MainCategory5', 'Subcategory7', ('Item7', 1.0)],
['MainCategory5', 'Subcategory8', ('Item8', 1.0)],
['MainCategory5', 'Subcategory9', ('Item9', 1.0)]],

['Name3',
['MainCategory3', 'Subcategory10', ('Item10', 1.0)], #<-note MainCategory3 again.
['MainCategory6', 'Subcategory11', ('Item11', 1.0)]]]

我需要解决这个问题。 IE。名称计入行,MainCategories 计入列,项目计入其 MainCategories。子类别可以被丢弃。

enter image description here

我到底该怎么做呢?我使用Python3已经很短时间了,我知道如何将上面的内容保存为可供Excel使用的csv文件,但我不知道如何按照我想要的方式构建它。如果我使用列表将所有 MainCategories 放入一个列表中,然后将项目计数放入另一个列表中,如何维护 MainCategories 和项目计数之间的关系?我应该做点别的事吗?也许使用字典?任何帮助将不胜感激,因为我不知道该怎么做。

最佳答案

这是通过 collections.defaultdictpandas 库的一种解决方案,给定列表 lst:

import pandas as pd
from collections import defaultdict

d = defaultdict(lambda: defaultdict(int))

for i in lst:
    for j in i[1:]:
        d[i[0]][j[0]] += 1

df = pd.DataFrame(index=sorted(d.keys()),
                  columns=sorted(set.union(*map(set, d.values()))))

for k, v in d.items():
    for w in v:
        df.loc[k, w] = d[k][w]

df = df.fillna(0).rename_axis('Name').reset_index()

然后您可以轻松地将其发送到 Excel:

df.to_excel('file.xlsx', index=False)

结果:

    Name  MainCategory1  MainCategory2  MainCategory3  MainCategory4  \
0  Name1              1              0              0              0   
1  Name2              0              3              1              1   
2  Name3              0              0              1              0   

   MainCategory5  MainCategory6  
0              0              0  
1              3              0  
2              0              1  

关于python - 将列表列表构建为 csv/Excel 的列和行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49318684/

相关文章:

python - 如何在 64 位环境中处理 ctypes 中的字符串数组 (char **)?

python - 如何从 python 列表中的前一个值中减去该值?

python - Pandas :更新和合并数据框的更好方法

python :按键错误 'shift'

python - Pandas:将列中的列表扩展到不同的行

Python:定义具有可变数量参数的函数

python - 查找 : any one of the substrings (whichever first) stored in a list; in a bigger string in Python 的出现位置

perl - 如何根据扩展名过滤文件名?

Python Pandas : Grouping a key : value csv import into rows

python - 为使用 urllib.urlretrieve 下载的文件添加时间戳