python - 计算高斯分布的标准差

标签 python math graph statistics gaussian

我有一个数字列表,当根据它的长度绘制时,我得到一个高斯分布。我想计算这个高斯分布的标准偏差,但是我得到的值(使用 np.std() 函数)显然太小了(我得到了 0.00143 之类的东西……而它应该是 8.234 之类的……)。我想我一直在计算 y 轴上的标准偏差,而不是 x 轴上的标准偏差(这是标准偏差应该在的位置),但我对如何做到这一点有点困惑?

我已经包含了我的代码和我正在尝试计算标准偏差的高斯图片。

#max_k_value_counter counts the number of times the maximum value of k comes up.

max_k_value_counter_sum = sum(max_k_value_counter)
prob_max_k_value = [0] * len(max_k_value_counter)

# Calculate the probability of getting a particular value for k
for i in range(len(max_k_value_counter)):
        prob_max_k_value[i] = float(max_k_value_counter[i]) / max_k_value_counter_sum

print "Std dev on prob_max_k_value", np.std(prob_max_k_value)

# Plot p(k) vs k_max to calculate the errors on k
plt.plot(range(len(prob_max_k_value)), prob_max_k_value)
plt.xlim(0, 200)
plt.xlabel(r"$k$", fontsize=16)
plt.ylabel(r"$p(k)$", fontsize=16)
plt.show()

enter image description here

最佳答案

您测量的是概率的标准差,而不是实际值;这是一个示例,我从真正的标准正态分布中得出:

>>> from scipy.stats import norm
>>> xs   = np.linspace(-3, 3, 100)
>>> pdf  = norm.pdf(xs)
>>> prob = pdf / pdf.sum() # these are probabilities
>>> np.std(prob)           # note the very small value below
0.008473522157507624

这里正确的方法是使用这个公式: variance

测量方差,然后取平方根得到标准差;第一项基本上是第二项,第二项是均方:

>>> mu   = xs.dot(prob)               # mean value
>>> mom2 = np.power(xs, 2).dot(prob)  # 2nd moment
>>> var  = mom2 - mu**2               # variance
>>> np.sqrt(var)                      # standard deviation
0.98764819824739092

请注意,我们得到的值非常接近 1,这与我从标准正态中得出的事实一致;

关于python - 计算高斯分布的标准差,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22686183/

相关文章:

python - 如何计算 Numpy stride-tricks block 中的元素数量?

c++ - 在加权树中,偏心率最小的顶点必须始终是树的根吗?

python - 需要星期天作为一周的第一天

algorithm - 将大数分解为三元组

python - 如何在Python中找到精确根(三次方)

python - 为什么在 Python/Numpy 中将 "Not a Number"值转换为 bool 值时等于 True?

MySQL:动态创建存储桶

javascript - 使用d3绘制散点图

python - pickle - cPickle.UnpicklingError : invalid load key, '?'

python - 改善简单的1层神经网络