假设我们有以下 pandas 数据框:
df = pd.DataFrame({'x':[0,0,1,0,0,0,0],'y':[1,1,1,1,1,1,0],'z':[0,1,1,1,0,0,1]})
x y z
0 0 1 0
1 0 1 1
2 1 1 1
3 0 1 1
4 0 1 0
5 0 1 0
6 0 0 1
所有数据帧都填充 1 或 0。分别查看每一列,如果当前行值与先前值不同,我需要计算先前连续值的数量:
x y z
0
1 1
2 2
3 1
4 3
5
6 6 2
我尝试编写一个 lambda 函数并将其应用于整个数据帧,但失败了。有什么想法吗?
最佳答案
让我们试试这个:
def f(col):
x = (col != col.shift().bfill())
s = x.cumsum()
return s.groupby(s).transform('count').shift().where(x)
df.apply(f).fillna('')
输出:
x y z
0
1 1
2 2
3 1
4 3
5
6 6 2
详细信息:
使用apply
,对数据框的每一列应用自定义函数。
找到列中的差异点,然后使用 cumsum
创建连续值组,然后 groupby
和transform
创建 count
对于每条记录,然后使用 where
屏蔽列中的值寻找差异点。
关于python - 查找 pandas 数据框中先前连续出现与当前行值不同的值的次数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60244071/