我有一个包含多个列的 Pandas 数据框。我有工作日的日期,不包括节假日和其他一些随机漏洞。是否有一种插值方法可以填补这些空白并获得所有工作日的数据框?
最佳答案
你可以使用 DataFrame 的 reindex() 方法:
x = pd.date_range('2013-01-01','2013-01-07',freq='D')
y = range(7)
df=pd.DataFrame(index=x,data=y,columns=['value'])
要添加缺失的日子(如假期),您需要重新索引它:
x2= pd.date_range('2013-01-01','2013-01-07',freq='4H')
df2=df.reindex(x2)
然后您可以使用 Series 的 interpolate() 方法填充值的空白(可以使用不同的插值方法):
df2.value=df2.value.interpolate(method='linear')
关于 Pandas 数据框插入缺失的日子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20240749/