python - 从数据帧创建字典避免重复

我有一个 2 列 df，其中包含特定的项目分布。第一列显示重复的项目。第二列中没有重复的项目。

我一直在尝试创建一个字典，其中键保存第一列的名称，值保存第二列的项目。让我们看看我的表格和我想创建的字典，以便更好地理解。

dict
{'A': '1', '2','3','4','9','C', 'B': '2', '3','4','29','34'}

有人可以引导我走向正确的方向吗？

最佳答案

关闭，需要的是列表的字典，值是字符串，因为C:

d = df.groupby('col1')['col2'].agg(list).to_dict()
print (d)
{'A': ['1', '2', '3', '4', '9', 'C'], 'B': ['2', '3', '4', '29', '34']}

关于python - 从数据帧创建字典避免重复，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61011015/

相关文章：

r - 在R中将数据帧从 "wide"格式转换为 "long"格式