python - 选择高于临界阈值的 pandas 数据框元素

标签 python pandas

我有一个 pandas.df,我正在尝试删除所有可以拒绝的假设。

这是有问题的 df 的一个片段:

    best value   p_value  
0      11.9549  0.986927  
1      11.9588  0.986896  
2      12.1185  0.985588  
3      12.1682  0.985161  
4      12.3907  0.983131  
5      12.4148  0.982899  
6      12.6273  0.980750  
7      12.9020  0.977680  
8      13.4576  0.970384  
9      13.5058  0.969679  
10     13.5243  0.969405  
11     13.5886  0.968439  
12     13.8025  0.965067  
13     13.9840  0.962011  
14     14.1896  0.958326  
15     14.3939  0.954424  
16     14.6229  0.949758  
17     14.6689  0.948783  
18     14.9464  0.942626  
19     15.1216  0.938494  
20     15.5326  0.928039  
21     17.7720  0.851915  
22     17.8668  0.847993  
23     17.9662  0.843822  
24     19.2481  0.785072  
25     19.5257  0.771242  

我想删除 p_value 大于临界阈值 alpha 的元素,方法是选择低于 alpha 的元素。 p 值是使用 scipy.stats.chisqprob(chisq,df) 计算的,其中 chisq 是卡方统计量,df 是自由度。这一切都是使用如下所示的自定义方法 self.get_p_values 完成的。

def reject_null_hypothesis(self,alpha,df):
    assert alpha>0
    assert alpha<1
    p_value=self.get_p_values(df)  #calculates the data frame above
    return p_value.loc[p_value['best value']

然后我调用这个方法使用:

PE=Modelling_Tools.PE_Results(PE_file)   #Modelling.Tools is the module and PE_Results is the class which is given the data 'PE_file' 
print PE.reject_null_hypothesis(0.5,25) 

根据我的阅读,这应该做我想做的,但我是 pandas.df 的新手,这段代码返回不变

最佳答案

运行时是否遇到任何错误?我问是因为:

print PE.reject_null_hypothesis(0.5, 25)

正在传递给 reject_null_hypothesis() 25,一个 int 对象而不是 pandas.DataFrame 对象,在最后一个参数位置。

(抱歉。我会用评论而不是答案来回应,但我目前只有 46 个声誉,评论需要 50 个。)

关于python - 选择高于临界阈值的 pandas 数据框元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32094305/

相关文章:

python - curl 工作正常,除非我用子进程调用它

python - Matplotlib 交互式条形图

python - 在 matplotlib 线图上向 x 轴和图例添加月份

python - Django render_to_response 渲染?

python - 无法完全取消选择 Blender 中的所有对象(使用脚本或键 A)

python - 在 pycharm : "Remote path not provided" 中创建新的 django 项目

python - 将 Pandas Dataframe 的索引拆分为单独的列

python - IO错误: [Errno 13] Permission denied Pandas

python - Pandas 选择至少一列中具有特定值的行

python - 从 Python 调用 gawk