pandas - 我如何解释 pandas 四分位数?

标签 pandas quantile quartile

我有一个带有A列的pandas datafram dfA 的值基于预测,我强制它们大于或等于 0.00000001。 现在,当我运行 df.A.describe() 时,我得到:

count    3.900000e+02
mean     1.047049e-05
std      7.774749e-05
min      1.000000e-08
25%      1.000000e-08
50%      1.000000e-08
75%      1.000000e-08
max      1.008428e-03+

按照我的理解,这意味着我的 A 值至少有 75% 等于 0.0000001。 但是,当我运行 x = len(df.loc[df['A'] == 0.00000001]) 时,我得到 x = 207 和 207/390 < 0.75。 难道我不应该得到大于 292 (390*0.75 = 292.5) 的 x 值吗?

最佳答案

对于可能遇到类似问题的人,我找到了答案:
我的 df 中只有 207 个值,其中 df.A == 0.00000001。然而,也有一些值稍微大一些(例如,可能 df.A == 0.0000000100000000001)。因此,即使这些值并不完全等于 0.00000001,当我打印 df 或要求 df.A.describe() 时它们显示为 0.00000001,因为差异非常小。

关于pandas - 我如何解释 pandas 四分位数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70693575/

相关文章:

python - seaborn violinplot 中的四分位数线属性

javascript - Javascript 中的递归四分位排序器

python - 如何在pandas数据框中查找具有相同时间间隔的行

python - Pandas:使用 [column name][row_number] 选择数组的值仅适用于 multiindex

r - 如何找到数字落在哪个分位数箱中

r - 检验分位数回归模型中的系数是否显着不同

python - pandas - 如何将列转换为日期时间对象

python - Pandas 。 pd.read_csv KeyError :not in index error

绘制分位数回归线