r - 偏移量不适用于二项式 GLM

我正在尝试使用 glm( family='binomial') 来拟合逻辑回归.

这是模型:

model<-glm(f_ocur~altitud+UTM_X+UTM_Y+j_sin+j_cos+temp_res+pp, 
           offset=(log(1/off)), data=mydata, family='binomial')

mydata有 76820 个观察值。
响应变量 (f_ocur) 为 0-1。
此数据是更大数据集的样本，因此设置偏移量的想法是考虑到此处使用的数据代表要分析的真实数据的样本。

由于某种原因，偏移量不起作用。当我运行这个模型时，我得到了一个结果，但是当我运行相同的模型但没有偏移时，我得到的结果与以前的模型完全相同。我期待不同的结果，但没有区别。

难道我做错了什么？偏移量应该与线性预测器一起使用吗？像这样:

model <- glm(f_ocur~altitud+UTM_X+UTM_Y+j_sin+j_cos+temp_res+pp+offset(log(1/off)), 
             data=mydata, family='binomial')

模型准备好后，我想将它与新数据一起使用。新数据将是验证此模型的数据，此数据具有相同的列。我的想法是使用:

validate <- predict(model, newdata=data2, type='response')

我的问题来了，预测函数是否考虑了用于创建模型的偏移量？如果没有，我应该怎么做才能获得新数据的正确概率？

最佳答案

我认为日志偏移用于泊松系列。在二项式的情况下，您不应该使用日志。查看链接 https://stats.stackexchange.com/questions/25415/using-offset-in-binomial-model-to-account-for-increased-numbers-of-patients

关于r - 偏移量不适用于二项式 GLM，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13237940/

r - 偏移量不适用于二项式 GLM

上一篇：extjs - 获取文本框的输入

下一篇：xslt - 检查变量 XSL 中有多少个字符