python - 如何向 MultiIndex 添加级别?

标签 python pandas dataframe multi-index

index = [np.array(['foo', 'foo', 'qux']),
         np.array(['a', 'b', 'a'])]
data = np.random.randn(3, 2)
columns = ["X", "Y"]
df = pd.DataFrame(data, index=index, columns=columns)
df.index.names = ["Level0", "Level1"]
print df

                      X         Y
Level0 Level1                    
foo    a       0.418549  0.252685
       b      -1.307099  0.202833
qux    a       0.046095 -0.968976

新等级

我想获取 df 的索引并创建一个现在具有附加级别的新 MultiIndex。

new_level_name = "New level"
new_level_labels = ['p', 'q']
# new_multi-index 

所需的多索引

Level0 Level1 Level2                    
foo    a      p       
              q       
       b      p      
              q       
qux    a      p      
              q      

最佳答案

最简单的是使用stack使用新的 DataFrame 以及按新级别值排列的列:

df1 = pd.DataFrame(data=1,index=df.index, columns=new_level_labels).stack()
df1.index.names = ['Level0','Level1',new_level_name]
print (df1)
Level0  Level1  New level
foo     a       p            1
                q            1
        b       p            1
                q            1
qux     a       p            1
                q            1
dtype: int64

print (df1.index)
MultiIndex(levels=[['foo', 'qux'], ['a', 'b'], ['p', 'q']],
           labels=[[0, 0, 0, 0, 1, 1], [0, 0, 1, 1, 0, 0], [0, 1, 0, 1, 0, 1]],
           names=['Level0', 'Level1', 'New level'])

关于python - 如何向 MultiIndex 添加级别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42612236/

相关文章:

python - 根据 pandas 中的特定子字符串或模式拆分字符串

python - 尝试将数据插入 postgresql 时出现语法错误

python - 使用 Pandas Python 更改数据框中数据透视数据的数据格式

r - 在 R 中,按列名而不是列号对列进行分组

Python C API 不加载模块

Python Tkinter 图形用户界面 :add text from an entry widget in a pop up window to a listbox in a different window?

Python:使用基于嵌套列表中唯一值的列创建 Pandas 数据框

python - 从 Pandas 中的索引中检索列的名称

python - 从 Pandas 数据透视表中的小计中获取总数的百分比

python - 将 Dataframe 分割成更小的 DatafFames