python - Numpy:比较两个数据集的适应性

标签 python numpy data-fitting

我对此一片空白。

我有两个数据集:

d1 = [(x1,y1), (x2,y2)...] 
d2 = [(x1,y1), (x2,y2)...]

我想获得某种类型的统计值,也许是 r 值之类的东西,它可以告诉我 d2d1 的拟合程度。

最佳答案

这取决于这两个向量是什么。您可能想要更具体。

如果它们类似于笛卡尔系统中的 X-Y 坐标,则距离相关性可能是最合适的 ( http://en.wikipedia.org/wiki/Distance_correlation#Alternative_formulation:_Brownian_covariance )。

如果x值相同,并且d1在每个x值下具有预期的y基于某个模型(即线性模型)并且 d2 具有观察到的 y 值,那么 Pearson 的 r 可能是一个不错的选择 scipy.stats.pearsonr >(http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient)。

如果 d1d2 都是相对频率数据(观察到的 y 值为 x 的事件计数) ,那么某种类型的拟合优度检验可能是正确的方向。 scipy.stats.chisquarescipy.stats.chi2_contingencyscipy.stats.ks_2samp 等等。

关于python - Numpy:比较两个数据集的适应性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20292995/

相关文章:

python - 输入预测/估计给定变量趋势所需的数据

python - 将风向分为几类

python - Python 中的可选正则表达式组失败

python - Numpy:确定广播后的形状

python - 在 NumPy 中使用 2 个维度进行索引时出错

python - 使用 Numpy 转换为 Web 墨卡托

python - python中使用leastsq同时拟合数据

Python评估与False相同值的整数和字符的比较

python - 元组列表的自定义排序

python - 如何拟合数据集以便它们共享一些(但不是全部)参数值