我有一个 2 列 df,其中包含特定的项目分布。第一列显示重复的项目。第二列中没有重复的项目。
我一直在尝试创建一个字典,其中键保存第一列的名称,值保存第二列的项目。让我们看看我的表格和我想创建的字典,以便更好地理解。
df
col1 col2
0 A 1
1 A 2
2 A 3
3 A 4
4 A 9
5 A C
6 B 2
7 B 3
8 B 4
9 B 29
10 B 34
...
dict
{'A': '1', '2','3','4','9','C', 'B': '2', '3','4','29','34'}
有人可以引导我走向正确的方向吗?
最佳答案
关闭,需要的是列表的字典,值是字符串,因为C
:
d = df.groupby('col1')['col2'].agg(list).to_dict()
print (d)
{'A': ['1', '2', '3', '4', '9', 'C'], 'B': ['2', '3', '4', '29', '34']}
关于python - 从数据帧创建字典避免重复,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61011015/