pandas - 我如何解释 pandas 四分位数？

我有一个带有A列的pandas datafram df。 A 的值基于预测，我强制它们大于或等于 0.00000001。现在，当我运行 df.A.describe() 时，我得到:

count    3.900000e+02
mean     1.047049e-05
std      7.774749e-05
min      1.000000e-08
25%      1.000000e-08
50%      1.000000e-08
75%      1.000000e-08
max      1.008428e-03+

按照我的理解，这意味着我的 A 值至少有 75% 等于 0.0000001。但是，当我运行 x = len(df.loc[df['A'] == 0.00000001]) 时，我得到 x = 207 和 207/390 < 0.75。难道我不应该得到大于 292 (390*0.75 = 292.5) 的 x 值吗？

最佳答案

对于可能遇到类似问题的人，我找到了答案:
我的 df 中只有 207 个值，其中 df.A == 0.00000001。然而，也有一些值稍微大一些(例如，可能 df.A == 0.0000000100000000001)。因此，即使这些值并不完全等于 0.00000001，当我打印 df 或要求 df.A.describe() 时它们显示为 0.00000001，因为差异非常小。

关于pandas - 我如何解释 pandas 四分位数？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/70693575/

上一篇：javascript - 如何用jest和vue-test-utils模拟上传文件进行测试

下一篇：typescript - 如何附加到编译时常量

相关文章：

python - seaborn violinplot 中的四分位数线属性

javascript - Javascript 中的递归四分位排序器

python - 如何在pandas数据框中查找具有相同时间间隔的行

python - Pandas:使用 [column name][row_number] 选择数组的值仅适用于 multiindex

r - 如何找到数字落在哪个分位数箱中

r - 检验分位数回归模型中的系数是否显着不同

python - pandas - 如何将列转换为日期时间对象

python - Pandas 。 pd.read_csv KeyError :not in index error

绘制分位数回归线