我有一组数据,其中包含两个等长的数据数组,或者我可以制作一个包含两项条目的数组,我想计算数据所代表的相关性和统计显着性(可能紧密相关,或者可能没有统计上显着的相关性)。
我正在使用 Python 编程并安装了 scipy 和 numpy。我看了看发现 Calculating Pearson correlation and significance in Python ,但这似乎希望对数据进行操作,使其落入指定范围。
我想,要求 scipy 或 numpy 给我两个数组的相关性和统计显着性的正确方法是什么?
最佳答案
如果你想计算 Pearson 相关系数,那么 scipy.stats.pearsonr
是可行的方法;虽然,重要性仅对较大的数据集有意义。该功能不需要对数据进行操作使其落入指定范围。相关值落在 [-1,1]
区间内,也许这就是混淆?
如果重要性不是特别重要,可以使用 numpy.corrcoef()
。
马氏距离确实考虑了两个阵列之间的相关性,但它提供的是距离度量,而不是相关性。 (从数学上讲,马氏距离不是真正的距离函数;不过,它可以在某些情况下直接使用以发挥巨大优势。)
关于python - 在 Python 中,如何计算两个数据数组之间的相关性和统计显着性?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11121762/