python - Pandas 关联表限制为 m 列 n 行

标签 python pandas dataframe correlation

我知道如何创建一个(可爱的)Pandas 相关表,按相关性排名:

c = df.corr().abs()
np.set_printoptions(threshold='nan')
s = c.unstack()
so = s.order(kind="quicksort")
pprint(so)

这太棒了。

问题是,这会输出整个值矩阵的相关性——对于交叉矩阵中的所有列 x 所有列。

但是,如果我只想检查一列(例如 df['m'])与所有其他列的相关性怎么办?

我是否需要创建两个数据框并检查它们之间的相关性?有没有更快的脚本?

最佳答案

IIUC,您可以像这样对 corr() DataFrame 进行切片:

c = df.corr()['m'].abs()
so = c.sort_values(kind='quicksort')
print(so)

关于python - Pandas 关联表限制为 m 列 n 行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37332244/

相关文章:

python - 音频设备名称中的特殊字符 : Pyaudio

python - 这是工厂模式的正确实现吗?

python - 执行引用同一列中先前值的计算

dataframe - 在 Julia 中,如果某些列不同,我如何组合多个数据框?

python - 如何过滤掉包含特定字符串的 'set' 类型值的 pandas df 行?

python - 如果列中的第一个值大于最后一个值,Numpy 删除数组中的列

python - 对文本文件的批量操作仅对一半文件执行

python - 根据不同数据框中的匹配值将摘要列添加到 Pandas 数据框中

python - 在索引上将两个 pandas 数据帧合并在一起时出错

python - 如何仅将 dtype bool 列的 Pandas 数据框中的 True 和 False 映射到 'Yes' 和 'No'?