python - 填补 Pandas 数据框中的日期空白

标签 python datetime csv pandas pad

我有以日期时间为索引的 Pandas DataFrame(从 .csv 加载).. 每天有/必须有一个条目。 问题是我有差距,即有些日子我根本没有数据。 在间隙中插入行(天)的最简单方法是什么?还有一种方法可以控制列中插入的内容作为数据!说 0 或复制前一天的信息或填充从前一天到下一天数据值范围内的滑动增加/减少值。

谢谢

这里缺少示例 01-03 和 01-04:

In [60]: df['2015-01-06':'2015-01-01']
Out[60]: 
           Rate  High (est)  Low (est)
Date                                      
2015-01-06  1.19643      0.0000     0.0000
2015-01-05  1.20368      1.2186     1.1889
2015-01-02  1.21163      1.2254     1.1980
2015-01-01  1.21469      1.2282     1.2014

仍在试验中,但这似乎可以解决问题:

df.set_index(pd.DatetimeIndex(df.Date),inplace=True)

然后重新采样...原因是导入带有 header-col-name Date 的 .csv 实际上并不是创建日期时间索引,而是 Frozen-list 无论如何。 resample() 期待:if isinstance(ax, DatetimeIndex): .....


这是我的最终解决方案:

  #make dates the index
  self.df.set_index(pd.DatetimeIndex(self.df.Date), inplace=True)
  #fill the gaps
  self.df = self.df.resample('D',fill_method='pad')
  #fix the Date column
  self.df.Date = self.df.index.values

我必须修复 Date 列,因为 resample() 只允许您对其进行填充。 不过它正确地修复了索引,所以我可以用它来修复日期列。

这里是修正后的数据片段:

2015-01-29 2015-01-29  1.13262      0.0000     0.0000
2015-01-30 2015-01-30  1.13161      1.1450     1.1184
2015-01-31 2015-01-31  1.13161      1.1450     1.1184
2015-02-01 2015-02-01  1.13161      1.1450     1.1184

01-30、01-31是新生成的数据。

最佳答案

您可以按天重新采样,例如如果每天有多个条目,则使用均值:

df.resample('D', how='mean')

然后您可以ffill 将 NaN 替换为前几天的结果。

参见 up and down sampling在文档中。

关于python - 填补 Pandas 数据框中的日期空白,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28466772/

相关文章:

python - 如何转置 3D 矩阵?

c# - DateTime.ToString() 不能按预期使用斜杠作为日期分隔符

python - Django - 字典更新序列元素 #0 的长度为 1; 2 是必需的

MySQL 左连接单个表

javascript - 如何在日期时间选择器中使用两个验证器

mysql - 如何将csv文件导入mysql表并自动递增

csv - Logstash不会将CSV数据加载到 Elasticsearch

python - 如何向 pandas 编写的 CSV 添加自定义列标签?

python - 提出了 PEP 8 E211 问题。不知道为什么

python - 自定义悬停框 Plotly : Python to Fit Text