我有 2 个数据框,我想在不复制列的情况下合并它们:
首先,我只从第二个数据框中获取唯一的列(如 this 中的答案):
cols_to_use = df2.columns.difference(df1)
我需要保留一列,它是我的唯一标识符,名称为 complete_name
现在,cols_to_use
不包含 complete_name
,因为它被标记为重复,我该如何添加它?我试过:
cols_to_use.append(pd.Index(['complete_name']))
但它什么都不做。有帮助吗?
最佳答案
对我来说效果不错:
df1 = pd.DataFrame({'A':list('abcdef'),
'B':[4,5,4,5,5,4],
'C':[7,8,9,4,2,3],
'D':[1,3,5,7,1,0],
'E':[5,3,6,9,2,4],
'F':list('aaabbb')})
cols_to_use = df1.columns.difference(['A','C'])
print (cols_to_use)
Index(['B', 'D', 'E', 'F'], dtype='object')
print (cols_to_use.append(pd.Index(['complete_name'])))
Index(['B', 'D', 'E', 'F', 'complete_name'], dtype='object')
print (cols_to_use.union(['complete_name']))
Index(['B', 'D', 'E', 'F', 'complete_name'], dtype='object')
关于python - 向 Pandas 索引添加一个值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51356152/