我正在使用 python 3.6 开发一个个人项目。我使用 pandas 从数据框中的 Excel 文件导入数据,然后将数据提取到多个列表中。
现在,我将举一个例子来准确说明我想要实现的目标。 所以我有 3 个输入列表 a、b 和 c(我确实在列表中插入了索引和一些额外的空格,这样更容易理解):
0 1 2 3 4 5 6
a=[1, 5, 6, [10,12,13], 1, [5,3] ,7]
b=[3, [1,2], 3, [5,6], [1,3], [5,6], 9]
c=[1, 0 , 4, [1,2], 2 , 8 , 9]
我正在尝试组合数据,以便在其中一个列表中有一个包含多个元素的列表时获得所有组合。所以输出需要像这样:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
a=[1, 5, 5, 6, 10,10,10, 10, 12, 12, 12, 12, 13, 13, 13, 13, 1, 1, 5, 5, 3, 3, 7]
b=[3, 1, 2, 3, 5, 5, 6, 6, 5, 5, 6, 6, 5, 5, 6, 6, 1, 3, 5, 6, 5, 6, 9]
c=[1, 0, 0, 4, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 2, 2, 8, 8, 8, 8, 9]
为了更清楚地说明这一点:
从原始列表来看,如果我们查看索引 1 的元素: a[1]=5,b[1]=[1,2],c[1]=0。这些在 1 和 2 索引位置上转换为以下值:a[1:3]=[ 5, 5 ]; b[1:3]=[1, 2]; c[1:3]=[ 0, 0]
这还需要应用于原始输入列表中的索引 3、4 和 5,以获得与上面示例输出类似的内容。
我希望能够将其推广到更多列表(a,b,c ...... n)。我已经能够对两个列表执行此操作,但是以一种完全不优雅、绝对不是Pythonic的方式。另外我认为我编写的代码不能推广到更多列表。
我正在寻找一些帮助,至少是一些阅读 Material 的指示,可以帮助我实现上面提出的目标。
谢谢!
最佳答案
你可以做这样的事情。 查看每一列,计算出组合,然后输出列表:
import pandas as pd
import numpy
a=[1, 5, 6, [10,12,13], 1, [5,3] ,7]
b=[3, [1,2], 3, [5,6], [1,3], [5,6], 9]
c=[1, 0 , 4, [1,2], 2 , 8 , 9]
df = pd.DataFrame([a,b,c])
final_df = pd.DataFrame()
i=0
for col in df.columns:
temp_df = pd.DataFrame(df[col])
get_combo = []
for idx, row in temp_df.iterrows():
get_combo.append([row[i]])
combo_list = [list(x) for x in numpy.array(numpy.meshgrid(*get_combo)).T.reshape(-1,len(get_combo))]
temp_df_alpha = pd.DataFrame(combo_list).T
i+=1
if len(final_df) == 0:
final_df = temp_df_alpha
else:
final_df = pd.concat([final_df, temp_df_alpha], axis=1, sort=False)
for idx, row in final_df.iterrows():
print (row.tolist())
输出:
[1, 5, 5, 6, 10, 10, 12, 12, 13, 13, 10, 10, 12, 12, 13, 13, 1, 1, 5, 5, 3, 3, 7]
[3, 1, 2, 3, 5, 6, 5, 6, 5, 6, 5, 6, 5, 6, 5, 6, 1, 3, 5, 6, 5, 6, 9]
[1, 0, 0, 4, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 8, 8, 8, 8, 9]
关于python - 组合多个列表中包含的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58373612/