好的,这看起来应该很容易通过合并或连接操作来完成,但我无法破解它。我在 Pandas 工作。
我有两个数据框,它们之间有重复的行,我想以没有行或列重复的方式组合它们。它会像这样工作
df1:
A B
a 1
b 2
c 3
df2:
A B
b 2
c 3
d 4
df3 = df1 combined with df2
A B
a 1
b 2
c 3
d 4
我尝试过的一些方法是选择一个行而不是另一个行(异或),然后附加它们,但我不知道如何进行选择。我的另一个想法是追加它们并删除重复的行,但我不知道如何做后者。
最佳答案
你想要一个 outer
merge
:
In [103]:
df1.merge(df2, how='outer')
Out[103]:
A B
0 a 1
1 b 2
2 c 3
3 d 4
上面的工作是因为它自然地找到两个 dfs 之间的公共(public)列并指定合并类型导致 df 具有所需的组合列的并集。
关于python - Pandas/Python 合并两个具有重复行的数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30911078/