我熟悉 Pandas 滚动窗口函数,但它们的步长始终为 1。我想在 Pandas 中执行移动聚合函数,但条目不重叠。
df.rolling(2).min()
将产生:
不适用 519 566 727 1099 12385
但是我想要一个步长为 2 的固定窗口,所以它会产生:
519 727 12385
因为使用固定窗口,所以它应该按该窗口的大小进行步进。
最佳答案
rolling
函数中没有这样的内置参数,但您可以计算常用的滚动函数,然后跳过每 n
行(其中 n= 2
在你的情况下)。
df.rolling(n).min()[n-1::n]
正如您在评论中提到的,这可能会导致许多冗余计算,这些计算将被忽略(特别是如果 n
很大)。
相反,您可以使用以下代码将数据分区(分组)到大小为 n 的容器中:
df.groupby(df.index // n).min()
我没有检查它是否确实更有效,但我相信它应该是。
关于python - pandas 数据框中不重叠的滚动窗口,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57595661/