Python Pandas : Reindex DataFrameGroupBy Object to Dataframe Error

标签 python pandas pandas-groupby

我有一个简单的初始数据框:

ID, ATTRIBUTE
1, thing2
1, thing3
1, thing3
2, thing7
2, thing7
2, thing2
3, thing1
3, thing2

我想创建一个简单的 groupby 对象,在其中获取 ATTRIBUTE 模式(如果它是多模式,我将结果称为“multithing”):

mode = lambda x: x.mode() if len(x) > 2 else 'multithing'
df_grouped = df.groupby(['ID'], as_index=False)['ATTRIBUTE].agg(mode)

我试图在重新索引后得到如下所示的结果:

ID, ATTRIBUTE
1, thing3
2, thing7
3, multithing

所以我可以再次像常规数据框一样使用它并执行如下操作:

df_final.groupby('ATTRIBUTE')['ID'].count()

最佳答案

IIUC:

In [203]: df.groupby('ID')['ATTRIBUTE'] \
            .agg(lambda x: x.mode()[0] if len(x.mode()) == 1 else 'multithing')
Out[203]:
ID
1        thing3
2        thing7
3    multithing
Name: ATTRIBUTE, dtype: object

In [205]: df.groupby('ID', as_index=False)['ATTRIBUTE'] \
     ...:   .agg(lambda x: x.mode()[0] if len(x.mode()) == 1 else 'multithing')
Out[205]:
   ID   ATTRIBUTE
0   1      thing3
1   2      thing7
2   3  multithing

关于Python Pandas : Reindex DataFrameGroupBy Object to Dataframe Error,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46819820/

相关文章:

python - groupby 一列并将剩余列转换为字典

python - 如何计算 scipy 稀疏矩阵行列式而不将其变为密集?

python - 一张图表在 Bokeh 中有两个不同的 y 轴范围?

python - 如何抓取带有特殊字符的数据?

python - Python 代码可以包含在 NetLogo 代码的主体中吗?

python - 替换 MultiIndex (pandas) 中的一个值

python - 在 Pandas 中进行复制时意外更改 df

python - 来自 Pandas DataFrame 的多个直方图叠加

python - 如何通过 DataFrame 压扁 Pandas group?

python - 如何使用 Pandas 对两列进行分组并计算行的总和?