我有一个带有A
列的pandas datafram df
。 A
的值基于预测,我强制它们大于或等于 0.00000001。
现在,当我运行 df.A.describe() 时,我得到:
count 3.900000e+02
mean 1.047049e-05
std 7.774749e-05
min 1.000000e-08
25% 1.000000e-08
50% 1.000000e-08
75% 1.000000e-08
max 1.008428e-03+
按照我的理解,这意味着我的 A 值至少有 75% 等于 0.0000001。
但是,当我运行 x = len(df.loc[df['A'] == 0.00000001])
时,我得到 x = 207
和 207/390 < 0.75。
难道我不应该得到大于 292 (390*0.75 = 292.5) 的 x 值吗?
最佳答案
对于可能遇到类似问题的人,我找到了答案:
我的 df 中只有 207 个值,其中 df.A == 0.00000001。然而,也有一些值稍微大一些(例如,可能 df.A == 0.0000000100000000001)。因此,即使这些值并不完全等于 0.00000001,当我打印 df 或要求 df.A.describe()
时它们显示为 0.00000001,因为差异非常小。
关于pandas - 我如何解释 pandas 四分位数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70693575/