我有两个具有相同标题的数据框。
当我尝试连接 (pd.concat()
) 这两个 dfs (df1, df2) 时,出现错误:
"InvalidIndexError: Reindexing only valid with uniquely valued Index objects"
我发现问题是每个数据框中都有重复的列名称。 示例:
df1
respondent ID - Column1 - Column2 - Column3 - Column1 - Column2 - Column3
df2
respondent ID - Column1 - Column2 - Column3 - Column1 - Column2 - Column3
理论上我只是想在df1下面添加df2的数据(不带df2 ofc的header)
如何绕过这个?有什么想法吗?
最佳答案
重复的列不应成为问题(即使使用ignore_index=False
):
df1 = pd.DataFrame([range(7)], columns=['respondent ID', 'Column1', 'Column2', 'Column3', 'Column1', 'Column2', 'Column3'])
df2 = pd.DataFrame([['2']*7], columns=['respondent ID', 'Column1', 'Column2', 'Column3', 'Column1', 'Column2', 'Column3'])
pd.concat([df1, df2], ignore_index=True)
输出:
respondent ID Column1 Column2 Column3 Column1 Column2 Column3
0 0 1 2 3 4 5 6
1 2 2 2 2 2 2 2
关于python - Pandas Concat 返回 "InvalidIndexError: Reindexing only valid with uniquely valued Index objects"错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69929277/