python - 滚动时间窗口上的 Pandas `value_counts`

标签 python pandas rolling-computation

我有一个包含字符串值和日期时间索引的 pandas 数据框,如下所示:

from datetime import datetime as dt
import pandas as pd

df = pd.DataFrame(['a', 'b', 'b', 'c', 'b', 'b', 'b'], 
                  [dt(2019, 1, 1), dt(2019, 1, 2), 
                   dt(2019, 1, 3), dt(2019, 1, 4), 
                   dt(2019, 1, 5), dt(2019, 1, 6), 
                   dt(2019, 1, 7)])

如果我想计算每个值在所有时间出现的实例数,我可以简单地调用:

>>> print(df[0].value_counts())
b    5
c    1
a    1
Name: 0, dtype: int64

我想创建一个滚动窗口并测量移动窗口中每个字符串的实例数,比如 2 天。有没有办法将 rollingvalue_counts 或类似方法结合起来?

最佳答案

我猜你要找的是:

pd.get_dummies(df[0]).rolling('2D').sum()

输出:

            a   b   c
2019-01-01  1.0 0.0 0.0
2019-01-02  1.0 1.0 0.0
2019-01-03  0.0 2.0 0.0
2019-01-04  0.0 1.0 1.0
2019-01-05  0.0 1.0 1.0
2019-01-06  0.0 2.0 0.0
2019-01-07  0.0 2.0 0.0

关于python - 滚动时间窗口上的 Pandas `value_counts`,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56466560/

相关文章:

R 在 data.table 中创建嵌套滚动列表

python - Pandas "cumulative"滚动_corr

python - Nltk安装

python - 在 Makefile 的内置 shell 函数中使用 make 变量

python - 如何在Python中找到素数

python - pandas DataFrame中设置索引的问题

python - 使用 tensorflow 数据集混洗输入文件

python - 来自 python 字典或 pandas 数据框/系列的日历热图 2 个月

python - 使用 pandas 拆分几列

R 中缺少日期的时间序列的滚动平均值