python - scipy.stats.zipf 中的参数是什么意思?

标签 python scipy statistics confidence-interval zipf

来自docs

The probability mass function for zipf is:

zipf.pmf(k, a) = 1/(zeta(a) * k**a) for k >= 1.

zipf takes a as shape parameter.

The probability mass function above is defined in the “standardized” form. To shift distribution use the loc parameter. Specifically, zipf.pmf(k, a, loc) is identically equivalent to zipf.pmf(k - loc, a).

但是ak指的是什么? “形状参数”是什么意思?

此外,在scipy.stats.zipf.interval中,还有一个alpha参数。

.interval()方法的描述很简单:

Endpoints of the range that contains alpha percent of the distribution

alpha 参数是什么意思?这是“置信区间”吗?

最佳答案

What does "shape parameter" mean?

顾名思义,形状参数决定分布的形状。当从形状参数不是什么开始时,这可能是最容易解释的:

  1. 位置参数会改变分布,但在其他方面保持不变。例如,正态分布的平均值是位置参数。如果X 服从均值mu 的正态分布,则X + a 服从均值mu + a 的正态分布。

  2. scale参数使分布更宽或更窄。例如,正态分布的标准差是一个尺度参数。如果 X 服从标准差 sigma 的正态分布,则 X * a 服从标准差 sigma * a 的正态分布>.

  3. 最后,shape 参数会更改分布的形状。例如,Gamma distribution有一个形状参数k,用于确定分布的倾斜程度(= 向一侧“倾斜”的程度)。

But what does the a and k refer to?

k 是由分布参数化的变量。使用zipf.pmf,您可以在给定形状参数a的情况下计算任意k的概率。下面的图演示了a如何改变分布的形状(不同 k 的个体概率)。

enter image description here

a使得k不太可能出现大值,而低a则使得k值较小可能和更大的k都是可能的。

What does the alpha parameter mean? Is that the "confidence interval"?

alpha 置信区间是错误的。这是置信水平。我想这就是你的意思。例如,alpha=0.95 表示您的置信区间为 95%。如果您从特定分布生成随机 k,其中 95% 将位于 zipf.interval 返回的范围内。

绘图代码:

from scipy.stats import zipf
import matplotlib.pyplot as plt
import numpy as np

k = np.linspace(0, 10, 101)

for a in [1.3, 2.6]:
    p = zipf.pmf(k, a=a)

    plt.plot(k, p, label='a={}'.format(a), linewidth=2)

plt.xlabel('k')
plt.ylabel('probability')

plt.legend()
plt.show()

关于python - scipy.stats.zipf 中的参数是什么意思?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42947874/

相关文章:

python - 如何使用 Python 求解一对非线性方程?

Python:数据帧列表中的标准差

python - 为什么运行 python 可执行文件后终端为空白?

python - 按日期时间值对 Python 字典进行排序

python - 当函数应用于行时, Pandas 的 .groupby 函数出现奇怪的问题

python - python 中 scipy 四元集成的问题

python - python3中的惰性切片

python - 将 namedtuple 的 __str__ 和 __repr__ 行为引入常规类

python-2.7 - PyMC 中的逻辑回归

machine-learning - 马尔可夫链蒙特卡罗,多元伯努利分布的建议分布?