python - 在 Python 中,如何计算两个数据数组之间的相关性和统计显着性?

标签 python numpy statistics scipy correlation

我有一组数据,其中包含两个等长的数据数组,或者我可以制作一个包含两项条目的数组,我想计算数据所代表的相关性和统计显着性(可能紧密相关,或者可能没有统计上显着的相关性)。

我正在使用 Python 编程并安装了 scipy 和 numpy。我看了看发现 Calculating Pearson correlation and significance in Python ,但这似乎希望对数据进行操作,使其落入指定范围。

我想,要求 scipy 或 numpy 给我两个数组的相关性和统计显着性的正确方法是什么?

最佳答案

如果你想计算 Pearson 相关系数,那么 scipy.stats.pearsonr 是可行的方法;虽然,重要性仅对较大的数据集有意义。该功能不需要对数据进行操作使其落入指定范围。相关值落在 [-1,1] 区间内,也许这就是混淆?

如果重要性不是特别重要,可以使用 numpy.corrcoef()

马氏距离确实考虑了两个阵列之间的相关性,但它提供的是距离度量,而不是相关性。 (从数学上讲,马氏距离不是真正的距离函数;不过,它可以在某些情况下直接使用以发挥巨大优势。)

关于python - 在 Python 中,如何计算两个数据数组之间的相关性和统计显着性?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11121762/

相关文章:

python - 将时间戳舍入到最接近的 30 秒

python - 如何在numpy中获得从高分辨率ndarray到低分辨率的映射

math - 超过 2 次分割的分割检验的显着性检验

python - 在 x 和 y 坐标的 numpy 数组中查找最近点的索引

python - 为什么 pip 不更新我的 numpy 和 scipy?

python - 没有 SciPy 的 PDF 和 CDF

algorithm - metropolis-hesting算法如何保证样本服从未知后验分布

python - 从 3D 列表绘制 3d 条形图

java - 启用 block 模式的开源 FTP 客户端

python - pygame运行一段时间后不断崩溃