python - 如何估计累积高斯拟合的正确参数？

我正在尝试将累积高斯分布拟合到我的数据中，但是拟合显然是错误的。为什么我得到的均值和标准差是错误的？您可以在下面找到我的代码和输出。

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

testrefratios=np.array([ 0.2,  0.4,  0.6,  0.8,  0.9,  1. ,  1.1,  1.2,  1.4,  1.6,  1.8])
Pn_final=np.array([ 0. ,   0. ,   0.03 , 0.35 , 0.47,  0.57 , 0.68,  0.73,  0.76 , 0.85 , 0.91])
Pd_final=np.array([ 0. ,   0.03,  0.36 , 0.85 , 0.97,  0.98 , 0.98 , 0.99 , 1.,    1.,    1.  ])

 # cumulative gaussian fit
fg = plt.figure(1); fg.clf()
ax = fg.add_subplot(1, 1, 1)
t = np.linspace(0,2, 1000) 

ax.grid(True)
ax.set_ylabel("Cumulative Probability Density")
ax.set_title("Fit to Normal Distribution")

mu1,sigma1 = norm.fit(Pn_final) # classical fit
ax.plot(t, norm.cdf(t, mu1, sigma1), alpha=.5)

mu1,sigma1 = norm.fit(Pd_final) # classical fit
ax.plot(t, norm.cdf(t, mu1, sigma1), alpha=.5)

ax.plot(testrefratios, Pn_final, 'bo',label='numerosity comparison')
ax.plot(testrefratios, Pd_final, 'ro', label='density comparison')

plt.legend(loc='lower right')


fg.canvas.draw()

输出:

最佳答案

目前，您所做的任何事情都没有告诉系统您正在尝试拟合累积高斯分布。 norm.fit(Pn_final) 在 Pn_final 表示高斯的假设下尽力而为。

一种方法是使用scipy.optimize.curve_fit，并添加

from scipy.optimize import curve_fit

mu1,sigma1 = curve_fit(norm.cdf, testrefratios, Pn_final, p0=[0,1])[0]
ax.plot(t, norm.cdf(t, mu1, sigma1), alpha=.5)

mu1,sigma1 = curve_fit(norm.cdf, testrefratios, Pd_final, p0=[0,1])[0]
ax.plot(t, norm.cdf(t, mu1, sigma1), alpha=.5)

给我

至少看起来更可信。

关于python - 如何估计累积高斯拟合的正确参数？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36355296/

python - 如何估计累积高斯拟合的正确参数？

上一篇：python - unittest 的 assert* 的 eval 版本是个好主意吗？

下一篇：python 用逗号分割字符串而不是在矩阵表达式内