r - 偏移量不适用于二项式 GLM

标签 r glm

我正在尝试使用 glm( family='binomial') 来拟合逻辑回归.

这是模型:

model<-glm(f_ocur~altitud+UTM_X+UTM_Y+j_sin+j_cos+temp_res+pp, 
           offset=(log(1/off)), data=mydata, family='binomial')
mydata有 76820 个观察值。
响应变量 (f_ocur) 为 0-1。
此数据是更大数据集的样本,因此设置偏移量的想法是考虑到此处使用的数据代表要分析的真实数据的样本。

由于某种原因,偏移量不起作用。当我运行这个模型时,我得到了一个结果,但是当我运行相同的模型但没有偏移时,我得到的结果与以前的模型完全相同。我期待不同的结果,但没有区别。

难道我做错了什么?偏移量应该与线性预测器一起使用吗?像这样:
model <- glm(f_ocur~altitud+UTM_X+UTM_Y+j_sin+j_cos+temp_res+pp+offset(log(1/off)), 
             data=mydata, family='binomial')

模型准备好后,我想将它与新数据一起使用。新数据将是验证此模型的数据,此数据具有相同的列。我的想法是使用:
validate <- predict(model, newdata=data2, type='response')

我的问题来了,预测函数是否考虑了用于创建模型的偏移量?如果没有,我应该怎么做才能获得新数据的正确概率?

最佳答案

我认为日志偏移用于泊松系列。在二项式的情况下,您不应该使用日志。查看链接 https://stats.stackexchange.com/questions/25415/using-offset-in-binomial-model-to-account-for-increased-numbers-of-patients

关于r - 偏移量不适用于二项式 GLM,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13237940/

相关文章:

r - 按 R 中的特定条件对列进行排序

r - 如何计算负二项式回归模型的预测概率?

python - rpy2 + 负二项式 glm

r - glmer : Error in eval(expr, envir, enclos) 中的错误:找不到有效的起始 > 值:请指定一些

glm - Confint() with glm {stats} 非常非常慢

R-markdown:在回显代码和结果输出之间添加一个空行

r - 使用 SparkR 2.0.0 进行并行分布式处理

r - 组内唯一ID

r - 从 R 中的 HTTPS 连接逐行读取

r - 将 GLM 变量名称和值与术语分开