python - 向 Pandas 索引添加一个值

我有 2 个数据框，我想在不复制列的情况下合并它们:

首先，我只从第二个数据框中获取唯一的列(如 this 中的答案):

cols_to_use = df2.columns.difference(df1)

我需要保留一列，它是我的唯一标识符，名称为 complete_name

现在，cols_to_use 不包含 complete_name，因为它被标记为重复，我该如何添加它？我试过:

cols_to_use.append(pd.Index(['complete_name']))

但它什么都不做。有帮助吗？

最佳答案

对我来说效果不错:

df1 = pd.DataFrame({'A':list('abcdef'),
                   'B':[4,5,4,5,5,4],
                   'C':[7,8,9,4,2,3],
                   'D':[1,3,5,7,1,0],
                   'E':[5,3,6,9,2,4],
                   'F':list('aaabbb')})

cols_to_use = df1.columns.difference(['A','C'])
print (cols_to_use)
Index(['B', 'D', 'E', 'F'], dtype='object')

print (cols_to_use.append(pd.Index(['complete_name'])))
Index(['B', 'D', 'E', 'F', 'complete_name'], dtype='object')

print (cols_to_use.union(['complete_name']))
Index(['B', 'D', 'E', 'F', 'complete_name'], dtype='object')

关于python - 向 Pandas 索引添加一个值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51356152/

上一篇：python - 在彼此之上显示 2 个 Seaborn 图

下一篇：python - Keras 教程错误 : NameError: name 'layers' is not defined

python - 带有嵌入 if 语句的 For 循环来更新数据帧

Python-pandas 将 NA 替换为数据框中一组的中位数或均值

python - 使用基于日期的条目填充 Pandas 数据框

python - 优化 python 处理从 fb-graph-api 检索的 json

Python:按组计算数据框中的特定事件

python - 如何从数据帧列字符串中提取周期和变量名称以进行多索引面板数据准备

python - 如何根据另一列的条件对 Pandas 中的一列进行子集化

python - 格式化日期时间以使用 pandas 绘制时间序列

python - 用多个元素替换列表中的一个元素