python - Pandas :查找具有第二高值的行的索引

标签 python pandas

我试图在执行 groupby 后获取具有第二高值的行的索引,但我没有得到正确的结果

df = pd.DataFrame({'Sp':['a','b','c','d','e','f'], 'Mt':['s1', 's1', 's2','s2','s2','s3'], 'Value':[1,2,3,4,5,6], 'count':[3,2,5,10,10,6]})

这样做

df.iloc[df.groupby(['Mt'])['Value'].apply(lambda x: (x!=max(x)).idxmax())]

回来了

    Mt  Sp  Value   count
0   s1  a   1   3
2   s2  c   3   5
5   s3  f   6   6

对于组 s2 ,应返回原始数据帧的索引 3。

最佳答案

由于“值”已经排序,您可以使用 nth :

In [11]: g = df.groupby("Mt", as_index=False)

In [12]: g.nth(-2)
Out[12]:
   Mt Sp  Value  count
0  s1  a      1      3
3  s2  d      4     10

否则我会先按值排序,df = df.sort_values("Value")

如果你想要最后一个(如果给定的组中少于两个),你也可以捕获它

In [21]: g = df.groupby("Mt")

In [22]: res = g.nth(-1)

In [23]: res.update(g.nth(-2))

In [24]: res
Out[24]:
   Sp  Value  count
Mt
s1  a      1      3
s2  d      4     10
s3  f      6      6

相关函数是 tail (获取最后两个元素):

In [31]: g.tail(2)
Out[31]:
   Mt Sp  Value  count
0  s1  a      1      3
1  s1  b      2      2
3  s2  d      4     10
4  s2  e      5     10
5  s3  f      6      6

关于python - Pandas :查找具有第二高值的行的索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33705799/

相关文章:

python - Python中的管道字符

python - 从 mssql 连接获取受影响的行数

python - 查找每行中最后一列匹配模式

python - 比较两个数据框并创建另一个

python - 将列表从一个数据框扩展到另一个数据框 pandas

python - 自定义夹层(使用不同的主题)

python - pip install mod-wsgi 的问题

python - bzr 如何创建提交钩子(Hook)?

python - 使用 pandas 向量函数查找匹配值对

python - 如何在 python 中对时间戳进行装箱并分配标签