python - 将 DataFrame 的列转换为字典键

我试图将 DataFrame 的三列转换为字典键。

我试图使用循环来转换每一列并跟踪 worker 的血型。血型不应该重复。

Name = df[:,['Name1','Name2','Name3']] 
Names = {}
Bloodtypes = {}
for i,key,key2 in enumerate(zip(...)):
    if key  in Names[key] and key in Blood types[key]:
        Names[key].append(i)
        Blood types[key].append(key2)
    else:
        Names[key]=[i]
        Blood types[key]=[key2]

     Blood Type    Name1    Name2    Name3
0    A             NaN       NaN      John
1    O             Adam     Smith     NaN
2    B             NaN      John       NaN   
3    AB            NaN       NaN       NaN
4    A             NaN       NaN       NaN
5    B             NaN       NaN       NaN

我期待以下内容。

 Bloodtypes = {"Blank":['AB','A','B'],""John":['A','B'],("Adam","Smith"):['O']}
 Names = {"Blank":[3,4,5],""John":[0,2],("Adam","Smith"):[1]}

最佳答案

这里我们使用stack创建新 key ，然后groupby to_dict

df['Newkey']=df[['Name1','Name2','Name3']].stack().groupby(level=0).apply(tuple)
df.Newkey=df.Newkey.fillna('Blank')
df.groupby('Newkey')['BloodType'].apply(list).to_dict()
Out[471]: {'Blank': ['AB', 'A', 'B'], ('John',): ['A', 'B'], ('Adam', 'Smith'): ['O']}
df.reset_index().groupby('Newkey')['index'].apply(list).to_dict()
Out[472]: {'Blank': [3, 4, 5], ('John',): [0, 2], ('Adam', 'Smith'): [1]}

关于python - 将 DataFrame 的列转换为字典键，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55737634/

上一篇：python - 修复 Pandas 中的 Groupby 长度

下一篇：python - 如何在列表数组上使用 np argmax？

相关文章：

python - 把一行拆分成一个字典，里面有多层键值对

python - 如何从包含特定列中特定字符串的 Pandas 数据框中删除行？

apache-spark - Spark SQL : apply aggregate functions to a list of columns

python - 在 Python 中替换 DataFrame 的所有单元格中的值

python - 使用 pandas 比较两个数据帧以返回新数据帧 - Python

python - 需要帮助创建具有两个参数的输入函数

python - 为什么具有相同值的列表不指向 python 中的相同内存位置？

python - 使用 pandas DataFrame 按行值过滤的列聚合

python - 根据列名称进行计算并获取名称作为计算的一部分

python - python中的二维数组