python - pandas如何在不创建新列的情况下进行外连接

标签 python pandas

我有 2 个这样的 pandas 数据框:

date      value
20100101  100
20100102  150

date      value
20100102  150.01
20100103  180

预期输出应该是:

date      value
20100101  100
20100102  150
20100103  180

第二个数据帧始终包含我想添加到第一个数据帧中的最新值。但是,同一天的在两个数据帧之间可能略有不同。我想忽略相同的日期并专注于将新日期和值添加到第一个数据帧中。

我在pandas中尝试过outer join,但它给了我两列value_xvalue_y,因为值本质上并不相同在相同的日期。有什么解决办法吗?

最佳答案

我相信需要concatdrop_duplicates :

df = pd.concat([df1,df2]).drop_duplicates('date', keep='last')
print (df)
       date   value
0  20100101  100.00
0  20100102  150.01
1  20100103  180.00
<小时/>
df = pd.concat([df1,df2]).drop_duplicates('date', keep='first')
print (df)
       date  value
0  20100101  100.0
1  20100102  150.0
1  20100103  180.0

关于python - pandas如何在不创建新列的情况下进行外连接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49645171/

相关文章:

python - 使用 Pandas,如何按天对 JSON 数据进行分组并计算出现次数?

python - 计算值是否存在于 pandas 数据框中列表的列中

python - 将一组区间简化为最简单的表示

python - 是否有可能立即重新加载 Python 模块?

python : Pandas pivot table for multiple columns at once which has duplicate values

python xlsxwriter : Keep header in excel when adding a table

python - 使用 Python mechanize 填写不在表单中的 HTML-InputFields

python 列表到 'n' 字符串数取决于列表的长度

python - 如何使用 SimpleHttpRequestHandler 运行 python

python - 如何在 sns countplot 中仅堆叠一根柱