python - 使用 Pandas 数据框按日期和小时对数据进行分组

标签 python pandas dataframe grouping

我正在使用 Pandas 数据框,我想将前五天和最后五天组合在一起。然后从该分组中,我想对同一小时的样本测量进行平均。即:在这 10 天中,平均从 00:00:00 开始的样本测量值。任何有关如何实现这一目标的指导将不胜感激。谢谢你。


约会时间
sample 测量


2019-08-17 00:00:00
10

2019-08-17 01:00:00
14

2019-08-17 02:00:00
12

2019-08-17 03:00:00
10

.....
....

2019-09-07 20:00:00
9

2019-09-07 21:00:00
7

2019-09-07 22:00:00
5

2019-09-07 23:00:00
3

最佳答案

首先,您需要使用 pandas.to_datetime 将 DateTime 列更改为日期时间对象方法
然后创建一个仅包含日期的新列,例如:

 df['date_only'] = df['Datetime'].dt.date 
会在你的情况下工作
然后使用 pandas groupby 和 mean 方法将所有相似的日期分组在一起,然后取其样本测量的平均值
例如:
df.groupby(['date_only'])['Sample Measurement'].mean()
会工作

关于python - 使用 Pandas 数据框按日期和小时对数据进行分组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67739849/

相关文章:

python - 将选定的 JSON 标签转换为 Pandas 数据框

python - Pandas 将列转换为行

python - 在 2 列上合并 pandas 数据帧,但顺序不限

python(pandas)在数据帧内合并,无需for循环

python - 检查数组元素是否相等

python - 在 python 中从 TIMIT 数据库读取 WAV 文件

python - 什么是 [Sci/Num]Python 相当于 Matlabs "norminv"(正态逆累积分布函数)

python - 使用 .readlines() 并努力访问列表

python - 根据值 0 的出现对 Pandas 中的列进行编码

python - 将函数应用于多个数据帧,返回多个 DF 作为输出