python - 使用多索引列展平 DataFrame

标签 python pandas pivot-table

我想将从数据透视表派生的 Pandas DataFrame 转换为如下所示的行表示形式。

这是我所在的地方:

import pandas as pd
import numpy as np
df = pd.DataFrame({
    'goods': ['a', 'a', 'b', 'b', 'b'],
    'stock': [5, 10, 30, 40, 10],
    'category': ['c1', 'c2', 'c1', 'c2', 'c1'],
    'date': pd.to_datetime(['2014-01-01', '2014-02-01', '2014-01-06', '2014-02-09', '2014-03-09'])
})
# we don't care about year in this example
df['month'] = df['date'].map(lambda x: x.month)
piv = df.pivot_table(["stock"], "month", ["goods", "category"], aggfunc="sum")
piv = piv.reindex(np.arange(piv.index[0], piv.index[-1] + 1))
piv = piv.ffill(axis=0)
piv = piv.fillna(0)
print piv

结果

stock            
goods        a       b    
category    c1  c2  c1  c2
month                     
1            5   0  30   0
2            5  10  30  40
3            5  10  10  40

这就是我想去的地方。

goods category month stock
    a       c1     1     5
    a       c1     2     0
    a       c1     3     0
    a       c2     1     0
    a       c2     2    10
    a       c2     3     0
    b       c1     1    30
    b       c1     2     0
    b       c1     3    10
    b       c2     1     0
    b       c2     2    40
    b       c2     3     0

Previously , 我用过

piv = piv.stack()
piv = piv.reset_index()
print piv

摆脱多索引,但这是因为我现在在两列上进行旋转(["goods", "category"]):

      month category stock    
goods                    a   b
0         1       c1     5  30
1         1       c2     0   0
2         2       c1     5  30
3         2       c2    10  40
4         3       c1     5  10
5         3       c2    10  40

有谁知道如何摆脱列中的多索引并将结果放入示例格式的 DataFrame 中?

最佳答案

>>> piv.unstack().reset_index().drop('level_0', axis=1)
   goods category  month   0
0      a       c1      1   5
1      a       c1      2   5
2      a       c1      3   5
3      a       c2      1   0
4      a       c2      2  10
5      a       c2      3  10
6      b       c1      1  30
7      b       c1      2  30
8      b       c1      3  10
9      b       c2      1   0
10     b       c2      2  40
11     b       c2      3  40

那么您只需将最后一列名称从 0 更改为 stock

关于python - 使用多索引列展平 DataFrame,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27576795/

相关文章:

python - 获取连续n次出现的值

excel - 用于创建 excel 数据透视表的 powershell 脚本

excel - 如何对同一字段求和两次,但在数据透视表中具有不同的求和标准?

vba - 无需 VBA 的复杂数据透视式汇总

python - 字典的稀疏数组 - 高效表示

python - 将聚合函数应用于 Pandas 分层索引中的多个索引片的系统方法

python - 使用键(字符串)作为方法的参数

Python读取大文件并在:之后分割

python - Numpy的where函数和长度报错信息

Python 加入列表