我得到了以下数据帧(样本):
date Value1 Value2
2007-05-25 11:50:00 1 15
2007-05-25 12:00:00 2 30
2007-05-25 12:10:00 3 25
2007-05-25 12:50:00 2 34
2007-05-25 13:00:00 9 35
2007-05-25 13:10:00 6 10
您可以看到从 2007-05-25 12:20:00
到 2007-05-25 12:40:00
的数据丢失了。我想做的是这样的数据框:
date Value1 Value2
2007-05-25 11:50:00 1 15
2007-05-25 12:00:00 2 30
2007-05-25 12:10:00 3 25
2007-05-25 12:20:00 NaN NaN
2007-05-25 12:30:00 NaN NaN
2007-05-25 12:40:00 NaN NaN
2007-05-25 12:50:00 2 34
2007-05-25 13:00:00 9 35
2007-05-25 13:10:00 6 10
一般来说我想看看哪一次我没有数据。我在想这样的事情:
DataRange = pd.date_range(data.index[0],data.index[-1])
data = data.reindex(DataRange, fill_value=nan)
但据我了解,通过测试 date_range
,该函数通过其名称表示其日期范围。所以我想知道是否有类似的分钟(在我的例子中是10分钟)或者是否有另一种方法来实现它。
最佳答案
调用resample
并将规则传递为“10Min”:
In [309]:
df.resample('10Min')
Out[309]:
Value1 Value2
date
2007-05-25 11:50:00 1 15
2007-05-25 12:00:00 2 30
2007-05-25 12:10:00 3 25
2007-05-25 12:20:00 NaN NaN
2007-05-25 12:30:00 NaN NaN
2007-05-25 12:40:00 NaN NaN
2007-05-25 12:50:00 2 34
2007-05-25 13:00:00 9 35
2007-05-25 13:10:00 6 10
可以找到一些示例 here
关于python - Pandas:按时间处理数据帧索引中缺失的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30104944/