<分区>
我有一个根据 id
列分组的数据框。对于每个组,我想获取包含最大值的行(整行,而不仅仅是值)。我可以通过首先获取每个组的最大值,然后创建一个过滤器数组,然后在原始数据帧上应用过滤器来做到这一点。像这样,
import pandas as pd
# Dummy data
df = pd.DataFrame({'id' : [1, 1, 1, 2, 2, 2, 3, 3, 4, 4, 4, 4],
'other_value' : ['a', 'e', 'b', 'b', 'a', 'd', 'b', 'f' ,'a' ,'c', 'e', 'f'],
'value' : [1, 3, 5, 2, 5, 6, 2, 4, 6, 1, 7, 3]
})
# Get the max value in each group
df_max = df.groupby('id')['value'].max()
# Create row filter
row_filter = [df_max[i]==v for i, v in zip(df['id'], df['value'])]
# Filter
df_target = df[row_filter]
df_target
Out[58]:
id other_value value
2 1 b 5
5 2 d 6
7 3 f 4
10 4 e 7
此解决方案有效,但不知何故似乎过于繁琐。有谁知道更好的方法来做到这一点。最好是oneliner。关于潜在的重复项,我稍后会处理这些问题:)