我有 2 个这样的 pandas 数据框:
date value
20100101 100
20100102 150
date value
20100102 150.01
20100103 180
预期输出应该是:
date value
20100101 100
20100102 150
20100103 180
第二个数据帧始终包含我想添加到第一个数据帧中的最新值。但是,同一天的值
在两个数据帧之间可能略有不同。我想忽略相同的日期并专注于将新日期和值添加到第一个数据帧中。
我在pandas中尝试过outer join
,但它给了我两列value_x
和value_y
,因为值本质上并不相同在相同的日期。有什么解决办法吗?
最佳答案
我相信需要concat
与 drop_duplicates
:
df = pd.concat([df1,df2]).drop_duplicates('date', keep='last')
print (df)
date value
0 20100101 100.00
0 20100102 150.01
1 20100103 180.00
<小时/>
df = pd.concat([df1,df2]).drop_duplicates('date', keep='first')
print (df)
date value
0 20100101 100.0
1 20100102 150.0
1 20100103 180.0
关于python - pandas如何在不创建新列的情况下进行外连接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49645171/