不进行统计的 Pandas 重采样

标签 pandas aggregation

我有一个五分钟的数据框:

rng = pd.date_range('1/1/2011', periods=60, freq='5Min')
df = pd.DataFrame(np.random.randn(60, 4), index=rng, columns=['A', 'B', 'C', 'D'])

                            A         B         C         D
2011-01-01 00:00:00  1.287045 -0.621473  0.482130  1.886648
2011-01-01 00:05:00  0.402645 -1.335942 -0.609894 -0.589782
2011-01-01 00:10:00 -0.311789  0.342995 -0.875089 -0.781499
2011-01-01 00:15:00  1.970683  0.471876  1.042425 -0.128274
2011-01-01 00:20:00 -1.900357 -0.718225 -3.168920 -0.355735
2011-01-01 00:25:00  1.128843 -0.097980  1.130860 -1.045019
2011-01-01 00:30:00 -0.261523  0.379652 -0.385604 -0.910902

我只想对 15 分钟间隔内的数据重新采样,但不汇总为统计数据(我不想要均值、中位数、标准差)。我想对 15 分钟间隔进行二次采样并获取实际数据。是否有内置方法来做到这一点?

我的输出是:
                            A         B         C         D                 
2011-01-01 00:00:00  1.287045 -0.621473  0.482130  1.886648                 
2011-01-01 00:15:00  1.970683  0.471876  1.042425 -0.128274                 
2011-01-01 00:30:00 -0.261523  0.379652 -0.385604 -0.910902                 

最佳答案

您可以重新采样到 15 分钟并取每组的“第一个”:

In [40]: df.resample('15min').first()
Out[40]:
                            A         B         C         D
2011-01-01 00:00:00 -0.415637 -1.345454  1.151189 -0.834548
2011-01-01 00:15:00  0.221777 -0.866306  0.932487 -1.243176
2011-01-01 00:30:00 -0.690039  0.778672 -0.527087 -0.156369
...

另一种方法是构建新的所需索引并进行重新索引(在这种情况下,这需要做更多的工作,但在不规则时间序列的情况下,这可确保每 15 分钟获取一次数据):
In [42]: new_rng = pd.date_range('1/1/2011', periods=20, freq='15min')

In [43]: df.reindex(new_rng)
Out[43]:
                            A         B         C         D
2011-01-01 00:00:00 -0.415637 -1.345454  1.151189 -0.834548
2011-01-01 00:15:00  0.221777 -0.866306  0.932487 -1.243176
2011-01-01 00:30:00 -0.690039  0.778672 -0.527087 -0.156369
...

关于不进行统计的 Pandas 重采样,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35303593/

相关文章:

python - append 数据框的更有效方法

join - 加入2个Elasticsearch索引后计算新字段并进行汇总

python - 嵌套列表结构中的聚合数据

python-2.7 - .ix (Pandas) 上的按位运算

elasticsearch - 嵌套聚合Elasticsearch

sql - 高效计算 SQL 中的重要术语

mongodb - Mongo 聚合和过滤器

python - Pandas 使用查找字典更新列中的值

python - 重命名非常大的 CSV 数据文件的列

python - 如何将列转换为矩阵、按日期过滤并对索引排序?