python - 从数据帧创建字典避免重复

标签 python pandas dataframe dictionary

我有一个 2 列 df,其中包含特定的项目分布。第一列显示重复的项目。第二列中没有重复的项目。

我一直在尝试创建一个字典,其中键保存第一列的名称,值保存第二列的项目。让我们看看我的表格和我想创建的字典,以便更好地理解。

df
  col1 col2
0 A     1
1 A     2
2 A     3
3 A     4
4 A     9
5 A     C
6 B     2
7 B     3
8 B     4
9 B     29
10 B    34
...
dict
{'A': '1', '2','3','4','9','C', 'B': '2', '3','4','29','34'}

有人可以引导我走向正确的方向吗?

最佳答案

关闭,需要的是列表的字典,值是字符串,因为C:

d = df.groupby('col1')['col2'].agg(list).to_dict()
print (d)
{'A': ['1', '2', '3', '4', '9', 'C'], 'B': ['2', '3', '4', '29', '34']}

关于python - 从数据帧创建字典避免重复,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61011015/

相关文章:

r - 在R中将数据帧从 "wide"格式转换为 "long"格式

python - Numpy array.resize() - 零 'first'

python - 通过(python)查询ansible全局组变量

python - 如何将此 json 代码写入 csv 文件?

python - Pandas Python - 对其他人进行分组计数

dataframe - Julia 从分组的数据框中选择一个组

python - 使用 Python 3.1 提交登录表单

python - 使用 to_pickle 在循环中保存多个数据帧

python - 如何在 pandas DataFrame 中将值从 6200000 转换为 6.2M 或 1900 到 1.90K 的列?

python-3.x - 根据其他列中的匹配项填充 `Pandas.DataFrame` 中的列