我有一个包含 3 列的数据框 ['X', 'Y', 'Z']
我想研究一下 X
和 Y
影响Z
的分布。为此,我想使用 nadaraya watson 的非参数回归器。在 statsmodels 中有一个名为 KernelReg 的类来实现它。
虽然我能够成功运行一维回归代码(X
上的 Z
和 Y 上的
),我很难运行它进行二维回归。 Z
我的代码如下:XYZ
是我的数据框
xv = XYZ['X'].values; yv = XYZ['Y'].values; zv = XYZ['Z'].values
from statsmodels.nonparametric.kernel_regression import KernelReg
ksrmv = KernelReg(endog=zv, exog= [xv, yv], var_type='c')
我得到的错误是无法将大小为 3171442 的数组 reshape 为形状 (2,1)
xv.shape = yv.shape = zv.shape =(1585721,)
我已经尝试了指定 exog 的不同替代方法,例如
XYZ.loc[:, ['X', 'Y']] or XYZ.loc[:, ['X', 'Y']].values or np.concatenate([xv[:, None], yv[:, None]])
总是同样的错误。
statsmodels中exog的描述中。它应该是自变量的列表。列表中的每个元素都是一个单独的变量,我不知道如何解释它。
最佳答案
我认为需要为同一字符串中的每个自变量给出变量类型(即在 var_type
参数中)。如果两个变量都是连续的,则您的情况的代码将是:
ksrmv = KernelReg(endog=zv, exog= [xv, yv], var_type='cc')
关于python - statsmodels 二维核回归,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49341965/