使用 python 的 Pandas 库,Dataframe.describe() function打印数据集的标准偏差。但是,文档页面未指定此标准偏差是否为 "uncorrected" standard deviation或“修正后”的标准偏差。
谁能告诉我它返回了哪一个?
最佳答案
这是校正后的样本标准偏差。
您可以通过一个简单的系列并应用公式让自己相信这一点:
In [11]: s = pd.Series([1, 2])
In [12]: s.std()
Out[12]: 0.70710678118654757
In [13]: from math import sqrt
....: sqrt(0.5)
Out[13]: 0.7071067811865476
以及校正样本标准偏差的公式:
In [14]: sqrt(1./(len(s)-1) * ((s - s.mean()) ** 2).sum())
Out[14]: 0.7071067811865476
关于python - Pandas Dataframe.describe() : Which kind of standard deviation?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25718228/