我有一个如下所示的数据框:
import pandas as pd
d = {'TransactionId' : pd.Series([633025, 634560],index = ['2018-01-07 22:30:00', '2018-01-08 19:00:00']),
'Value' : pd.Series([677.06, 677.44], index = ['2018-01-07 22:30:00', '2018-01-08 19:00:00'])}
df = pd.DataFrame(d)
df.head()
一旦 TransactionId 633025 完成,值就会停止记录,直到下一个事务开始。我想在两次出现之间每 15 分钟添加一个日期时间索引值,TransactionId 为“NaN”,并向前填充 Value 列。我尝试使用 .resample 和 .asfreq 但没有任何运气;使用“15分钟”的时间段不会相应地修改数据帧。我怎样才能做到这一点?
最佳答案
首先,将索引设置为datetime
,然后您可以使用.resample
,然后使用.ffill
import pandas as pd
df.index = pd.to_datetime(df.index)
df = df.resample('15min').asfreq()
df['Value'] = df['Value'].ffill()
输出:
TransactionId Value
2018-01-07 22:30:00 633025.0 677.06
2018-01-07 22:45:00 NaN 677.06
2018-01-07 23:00:00 NaN 677.06
2018-01-07 23:15:00 NaN 677.06
2018-01-07 23:30:00 NaN 677.06
...
2018-01-08 18:00:00 NaN 677.06
2018-01-08 18:15:00 NaN 677.06
2018-01-08 18:30:00 NaN 677.06
2018-01-08 18:45:00 NaN 677.06
2018-01-08 19:00:00 634560.0 677.44
关于python-3.x - Pandas .resample 或 .asfreq 填充缺失的日期时间条目,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52370480/