我知道如何创建一个(可爱的)Pandas 相关表,按相关性排名:
c = df.corr().abs()
np.set_printoptions(threshold='nan')
s = c.unstack()
so = s.order(kind="quicksort")
pprint(so)
这太棒了。
问题是,这会输出整个值矩阵的相关性——对于交叉矩阵中的所有列 x 所有列。
但是,如果我只想检查一列(例如 df['m']
)与所有其他列的相关性怎么办?
我是否需要创建两个数据框并检查它们之间的相关性?有没有更快的脚本?
最佳答案
IIUC,您可以像这样对 corr()
DataFrame
进行切片:
c = df.corr()['m'].abs()
so = c.sort_values(kind='quicksort')
print(so)
关于python - Pandas 关联表限制为 m 列 n 行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37332244/