python - 在 python 中聚合时间序列

标签 python pandas time-series timeserieschart

我们如何按小时或分钟粒度聚合时间序列?如果我有如下所示的时间序列,那么我希望这些值按小时聚合。 pandas 是否支持它或者是否有在 python 中实现它的好方法?

timestamp, value
2012-04-30T22:25:31+00:00, 1
2012-04-30T22:25:43+00:00, 1
2012-04-30T22:29:04+00:00, 2
2012-04-30T22:35:09+00:00, 4
2012-04-30T22:39:28+00:00, 1
2012-04-30T22:47:54+00:00, 8
2012-04-30T22:50:49+00:00, 9
2012-04-30T22:51:57+00:00, 1
2012-04-30T22:54:50+00:00, 1
2012-04-30T22:57:22+00:00, 0
2012-04-30T22:58:38+00:00, 7
2012-04-30T23:05:21+00:00, 1
2012-04-30T23:08:56+00:00, 1

我还尝试通过以下调用确保我的数据框中的数据类型正确:

  print data_frame.dtypes

我得到以下输出

ts     datetime64[ns]
val             int64

当我在数据框上调用 group by 时

grouped = data_frame.groupby(lambda x: x.minute)

我收到以下错误:

grouped = data_frame.groupby(lambda x: x.minute)
AttributeError: 'int' object has no attribute 'minute'

最佳答案

http://pandas.pydata.org/pandas-docs/dev/generated/pandas.DataFrame.resample.html DataFrame.resample 方法。您可以在此处指定聚合方式,在您的情况下为 sum

data_frame.resample("1Min", how="sum")

http://pandas.pydata.org/pandas-docs/dev/timeseries.html#up-and-downsampling

关于python - 在 python 中聚合时间序列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29248280/

相关文章:

R ggplot - 一起使用 geom_box plot 和 geom_ribbon

python - 获取滚动 15 分钟的最大值

python - Pandas 以 "seasonal"频率重新采样

python - 我如何在 pymongo 中填充?

python - 当系统上有几个可用的 Python 版本时,如何安装 Jinja2 模板引擎?

python - python有像C一样的逗号运算符吗

python - matplotlib 具有 float 值范围的二维数据

python - Pandas:如何重用数据中的索引信息?

python - 使用 Python 将 Pandas 数据框剪切为 shapefile

python - 如何存储 pandas Panel 实例?