python - NumPy cov(协方差)函数的简单实现

我试图实现numpy.cov()函数，如下所示:numpy cov (covariance) function, what exactly does it compute? ，但我得到了一些奇怪的结果。请纠正我:

import numpy as np  
def my_covar(X):  
    X -= X.mean(axis=0)  
    N = X.shape[1]  
    return np.dot(X, X.T.conj())/float(N-1)

X = np.asarray([[1.0,1.0],[2.0,2.0],[3.0,3.0]])

## Run NumPy's implementation
print np.cov(X)
"""  
NumPy's output:
[[ 0.  0.  0.]
 [ 0.  0.  0.]
 [ 0.  0.  0.]]
"""

## Run my implementation
print my_covar(X)  
"""  
My output:  
[[ 2.  0.  -2.]  
 [ 0.  0.  0.]  
 [ -2.  0.  2.]]  
"""

出了什么问题？

最佳答案

您的函数和 np.cov(默认情况下)均假定 X 的行对应于变量，列对应于观察。

当您通过减去平均值来居中 X 时，您需要计算观测值的平均值，即 X 的列而不是行: