我有两个数据框,它们都具有相同的基本架构。 (4 个日期字段、几个字符串字段和 4-5 个浮点字段)。称它们为 df1
和 df2
。
我想做的基本上是获得两者的“差异”——我在其中返回所有未在两个数据帧之间共享的行(不在集合交集中)。请注意,两个数据帧的长度不必相同。
我尝试使用 pandas.merge(how='outer')
但我不确定要传递哪一列作为“键”,因为确实没有一个,而且我有各种组合试过没有用。 df1
或 df2
可能有两行(或更多行)相同。
在 pandas/Python 中执行此操作的好方法是什么?
最佳答案
试试这个:
diff_df = pd.merge(df1, df2, how='outer', indicator='Exist')
diff_df = diff_df.loc[diff_df['Exist'] != 'both']
您将拥有 df1 和 df2 上都不存在的所有行的数据框。
关于python - Pandas 中两个数据框之间的差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47131361/