Python/Pandas
所以我有 n 个仅由 3 列组成的数据框,如下所示:
02-10-2017 09:00:00, 0, 2.23, -2.24
02-10-2017 09:01:00, 0, 2.23, -2.23
...
日期时间是索引(格式为 DatetimeIndex)。
现在每个数据帧都有m 个索引/行,并且每个数据帧在另一个数据帧之后开始特定的时间。
例如,数据帧 1 从 02-10-2017 09:00 到 02-10-2017 15:00,数据帧 2 从 02-10-2017 10:00 到 02-10-2017 16:00。我想添加这些,以便我在 09:00 到 16:00 之间有一个带有附加值的数据帧。
我找到的最接近的函数是pandas.add()但是,当我添加两个数据帧时,不重合的索引将获得值 NaN。
因此,在我的示例中,这意味着从 09:00 到 10:00 以及从 15:00 到 16:00 的 NaN 值。有建议吗?
最佳答案
我刚刚才发现它。 NaN 值并非源自非重合索引,而是源自
x(来自 df1)+ NaN(来自 df2)= NaN
fill_value 选项可以将一个数据帧的 NaN 值设置为等于任何指定值。就我而言,fill_value=0
解决了问题。
关于python - pandas add() 两个具有部分重叠索引的数据帧?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50506610/