我有一个简单的初始数据框:
ID, ATTRIBUTE
1, thing2
1, thing3
1, thing3
2, thing7
2, thing7
2, thing2
3, thing1
3, thing2
我想创建一个简单的 groupby 对象,在其中获取 ATTRIBUTE 模式(如果它是多模式,我将结果称为“multithing”):
mode = lambda x: x.mode() if len(x) > 2 else 'multithing'
df_grouped = df.groupby(['ID'], as_index=False)['ATTRIBUTE].agg(mode)
我试图在重新索引后得到如下所示的结果:
ID, ATTRIBUTE
1, thing3
2, thing7
3, multithing
所以我可以再次像常规数据框一样使用它并执行如下操作:
df_final.groupby('ATTRIBUTE')['ID'].count()
最佳答案
IIUC:
In [203]: df.groupby('ID')['ATTRIBUTE'] \
.agg(lambda x: x.mode()[0] if len(x.mode()) == 1 else 'multithing')
Out[203]:
ID
1 thing3
2 thing7
3 multithing
Name: ATTRIBUTE, dtype: object
或
In [205]: df.groupby('ID', as_index=False)['ATTRIBUTE'] \
...: .agg(lambda x: x.mode()[0] if len(x.mode()) == 1 else 'multithing')
Out[205]:
ID ATTRIBUTE
0 1 thing3
1 2 thing7
2 3 multithing
关于Python Pandas : Reindex DataFrameGroupBy Object to Dataframe Error,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46819820/