我试图在执行 groupby 后获取具有第二高值的行的索引,但我没有得到正确的结果
df = pd.DataFrame({'Sp':['a','b','c','d','e','f'], 'Mt':['s1', 's1', 's2','s2','s2','s3'], 'Value':[1,2,3,4,5,6], 'count':[3,2,5,10,10,6]})
这样做
df.iloc[df.groupby(['Mt'])['Value'].apply(lambda x: (x!=max(x)).idxmax())]
回来了
Mt Sp Value count
0 s1 a 1 3
2 s2 c 3 5
5 s3 f 6 6
对于组 s2 ,应返回原始数据帧的索引 3。
最佳答案
由于“值”已经排序,您可以使用 nth
:
In [11]: g = df.groupby("Mt", as_index=False)
In [12]: g.nth(-2)
Out[12]:
Mt Sp Value count
0 s1 a 1 3
3 s2 d 4 10
否则我会先按值排序,df = df.sort_values("Value")
。
如果你想要最后一个(如果给定的组中少于两个),你也可以捕获它
In [21]: g = df.groupby("Mt")
In [22]: res = g.nth(-1)
In [23]: res.update(g.nth(-2))
In [24]: res
Out[24]:
Sp Value count
Mt
s1 a 1 3
s2 d 4 10
s3 f 6 6
相关函数是 tail
(获取最后两个元素):
In [31]: g.tail(2)
Out[31]:
Mt Sp Value count
0 s1 a 1 3
1 s1 b 2 2
3 s2 d 4 10
4 s2 e 5 10
5 s3 f 6 6
关于python - Pandas :查找具有第二高值的行的索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33705799/