python - 融化 Pandas 数据框的上三角矩阵

标签 python pandas numpy reshape melt

给定一个如下形式的方形 pandas DataFrame:

   a  b  c
a  1 .5 .3
b .5  1 .4
c .3 .4  1

upper triangle 怎么可能?被熔化得到如下形式的矩阵

 Row     Column    Value
  a        a       1
  a        b       .5 
  a        c       .3
  b        b       1
  b        c       .4
  c        c       1 

#Note the combination a,b is only listed once.  There is no b,a listing     

我对惯用的 pandas 解决方案更感兴趣,自定义索引器很容易手动编写...

提前感谢您的考虑和回复。

最佳答案

首先,我通过 wheredf 的较低值转换为 NaNnumpy.triu然后 stack , reset_index并设置列名:

import numpy as np

print df
     a    b    c
a  1.0  0.5  0.3
b  0.5  1.0  0.4
c  0.3  0.4  1.0

print np.triu(np.ones(df.shape)).astype(np.bool)
[[ True  True  True]
 [False  True  True]
 [False False  True]]

df = df.where(np.triu(np.ones(df.shape)).astype(np.bool))
print df
    a    b    c
a   1  0.5  0.3
b NaN  1.0  0.4
c NaN  NaN  1.0

df = df.stack().reset_index()
df.columns = ['Row','Column','Value']
print df

  Row Column  Value
0   a      a    1.0
1   a      b    0.5
2   a      c    0.3
3   b      b    1.0
4   b      c    0.4
5   c      c    1.0

关于python - 融化 Pandas 数据框的上三角矩阵,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34417685/

相关文章:

python - GAE : Can't use imported class with Endpoints API method

python - 如何在百万文档分类中找到异常值?

python - 如何将字符串值插入到 python pandas 的特定列值中?

python - 根据条件使用 python 中另一列的值创建新列

python - Jupyter Notebook - ModuleNotFoundError

python - 在终端中运行 django python 文件

python - axis = 0 似乎在 sum() 和 dropna() 中表现不同

python - 根据多个条件替换 Pandas 数据框中的值

arrays - 在 numpy 数组中每行提取固定数量的元素

python - 如何生成正确形式的 Toeplitz 矩阵以执行离散卷积?