python - groupby pandas dataframe 并创建另一个 dataframe 水平表示 groupby 结果

标签 python pandas dataframe

我有一个名为 usabledata 的 pandas 数据框,列为 ['marker','action','id']

usabledata = pd.DataFrame(columns=['marker','action','id'])

我在 usabledata 数据帧上运行了以下命令:

counts = usabledata.groupby(['marker','action']).count()
counts = counts.drop(['marker','action'])
print counts

                        id 
marker  action   
1       A               377 
        B               224
        C               9881 
        D               149946 
2       A               481 
        B               397
        C               7468 
        D               147581 
3       A               538 
        B               458
        D               145916

现在,我想创建一个具有以下格式的 pandas 数据框:

Marker      A      B     C     D
1           377    224   9881   149946
2           481    397   7468   147581
3           538    458   0      145916

是否可以在 ipython notebook 中使用 pandas dataframe 来做到这一点?

此外,是否可以在获得所需输出后删除列,例如“C”列?

同一问题的另一个疑问,在获得所需的输出后,如何添加另一列“分数”,它只是列“A”和“D”的比率?

最佳答案

IIUC 那么你可以调用unstackfillna :

In [124]:
gp.unstack().fillna(0)

Out[124]:
       action                   
marker      A    B     C       D
id                              
1         377  224  9881  149946
2         481  397  7468  147581
3         538  458     0  145916

关于python - groupby pandas dataframe 并创建另一个 dataframe 水平表示 groupby 结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36174115/

相关文章:

python - Django Formset 不会按用户对象进行过滤

c++ - 帮助处理 JSON 格式

python / Pandas :How does one pivot a table whereby the unique values in a specified multi -index or column form part of the resultant column name?

python - 根据行值保留数据框列

python - 如何使具有重复日期时间索引条目的数据框唯一?

python - 以编程方式编辑 pyqt4 python 中的选项卡顺序

python - pyqtgraph 与 Qt 设计器 : how to add PlotItems to GraphicsLayoutWidget

python - 如何将 4 个多索引级别行层次结构从 excel 上传到 pandas 数据框?

dataframe - 添加一个列来计算累积的先前重复值

python - 如何在循环中使用 Pandas 字符串包含(str.contain)?