python - Pandas Dataframe.describe() : Which kind of standard deviation?

标签 python pandas dataframe standard-deviation

使用 python 的 Pandas 库,Dataframe.describe() function打印数据集的标准偏差。但是,文档页面未指定此标准偏差是否为 "uncorrected" standard deviation或“修正后”的标准偏差。

谁能告诉我它返回了哪一个?

最佳答案

这是校正后的样本标准偏差
您可以通过一个简单的系列并应用公式让自己相信这一点:

In [11]: s = pd.Series([1, 2])

In [12]: s.std()
Out[12]: 0.70710678118654757

In [13]: from math import sqrt
   ....:  sqrt(0.5)
Out[13]: 0.7071067811865476

以及校正样本标准偏差的公式:

In [14]: sqrt(1./(len(s)-1) * ((s - s.mean()) ** 2).sum())
Out[14]: 0.7071067811865476

关于python - Pandas Dataframe.describe() : Which kind of standard deviation?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25718228/

相关文章:

python - 使用 Python passlib 创建密码

python - 递归重命名本地文件系统上的目录/文件结构

python,创建动态 html 名称值..

performance - 如何按组加速 Pandas 多级数据帧移动?

r - 根据条件将值从一行复制到另一行

r - 如何对一列值求和并按另一列的间隔对它们进行分组

python - 从我的虚拟主机运行一个基于 selenium 的脚本

python - 如何使用 dask 读取 csv 并处理行?

python - 以合适的格式对 pandas 数据框进行分组以创建图表

python - 使用基于另一列的 groupby 的最小最大标准化来标准化数据帧的列