python - 如何估计累积高斯拟合的正确参数?

标签 python numpy curve-fitting gaussian

我正在尝试将累积高斯分布拟合到我的数据中,但是拟合显然是错误的。为什么我得到的均值和标准差是错误的?您可以在下面找到我的代码和输出。

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

testrefratios=np.array([ 0.2,  0.4,  0.6,  0.8,  0.9,  1. ,  1.1,  1.2,  1.4,  1.6,  1.8])
Pn_final=np.array([ 0. ,   0. ,   0.03 , 0.35 , 0.47,  0.57 , 0.68,  0.73,  0.76 , 0.85 , 0.91])
Pd_final=np.array([ 0. ,   0.03,  0.36 , 0.85 , 0.97,  0.98 , 0.98 , 0.99 , 1.,    1.,    1.  ])

 # cumulative gaussian fit
fg = plt.figure(1); fg.clf()
ax = fg.add_subplot(1, 1, 1)
t = np.linspace(0,2, 1000) 

ax.grid(True)
ax.set_ylabel("Cumulative Probability Density")
ax.set_title("Fit to Normal Distribution")

mu1,sigma1 = norm.fit(Pn_final) # classical fit
ax.plot(t, norm.cdf(t, mu1, sigma1), alpha=.5)

mu1,sigma1 = norm.fit(Pd_final) # classical fit
ax.plot(t, norm.cdf(t, mu1, sigma1), alpha=.5)

ax.plot(testrefratios, Pn_final, 'bo',label='numerosity comparison')
ax.plot(testrefratios, Pd_final, 'ro', label='density comparison')

plt.legend(loc='lower right')


fg.canvas.draw()

输出:

Fit results with code shown

最佳答案

目前,您所做的任何事情都没有告诉系统您正在尝试拟合累积高斯分布。 norm.fit(Pn_final)Pn_final 表示高斯的假设下尽力而为。

一种方法是使用scipy.optimize.curve_fit,并添加

from scipy.optimize import curve_fit

mu1,sigma1 = curve_fit(norm.cdf, testrefratios, Pn_final, p0=[0,1])[0]
ax.plot(t, norm.cdf(t, mu1, sigma1), alpha=.5)

mu1,sigma1 = curve_fit(norm.cdf, testrefratios, Pd_final, p0=[0,1])[0]
ax.plot(t, norm.cdf(t, mu1, sigma1), alpha=.5)

给我

example fit

至少看起来更可信。

关于python - 如何估计累积高斯拟合的正确参数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36355296/

相关文章:

python - 用python进行简单的数值计算

python - 如何通过 excel 为我的物理实验课使用 python、PyLab、NumPy 等

python - 删除重复行?

python - 将 NumPy 数组转换为 Python 列表

python - 使用 python scipy.optimize.minimize 时如何确保解决方案是全局最小值

function - 在 gnuplot 中拟合分段函数

python - 查找数据异常值

python - 使用二变量样条与 scipy.ndimage.geometric_transform 来配准图像

r - nls 中的错误 - 迭代次数超过最大值

r - 为什么 nls 和 nlsLM 可以正确拟合泊松分布,但无法拟合负二项分布?