r - 在 R 中对重复情况使用权重(特别是二元响应的 gam)

标签 r loess gam mgcv cart-analysis

我注意到许多 R 模型允许“权重”参数(例如 cart、loess、gam,...)。大多数帮助函数将其描述为数据的“先验权重”,但这实际上意味着什么?

我有包含许多重复案例和二进制响应的数据。我希望我可以使用“权重”来编码输入和响应的每种组合发生的次数,但这似乎不起作用。我还尝试将成功的比例作为响应,并为每个协变量组合的总试验权重,但这似乎也不起作用(至少对于 gam 来说)。我正在尝试对上面列出的所有模型类型执行此操作,但对于初学者来说,如何对 gam [mgcv 包] 执行此操作?

最佳答案

二项式响应的权重有一个自然的解释:每个观察值对应的试验次数。如果您进行了 n 次试验,其中 p 取得了成功,则可以将其与

glm(p/n ~ x, family=binomial, weights=n)

对于 gammgcv 包中的 gam 也同样适用。

关于r - 在 R 中对重复情况使用权重(特别是二元响应的 gam),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17752502/

相关文章:

在 R 中 reshape 表格 - 更好的方法?

R:如何将列表拆分为 AM/PM

r - 使用 R 中的 Lowess 函数对新值进行预测

r - qqplot2 中的 LOESS 置信区间过窄

r - model.frame.default : variable lengths differ 中的错误

r - 调用 R 脚本/函数在 Windows 后台运行

r - 生成没有重复值的 pandoc 表

r - 删除超出黄土曲线极限的值

r - 具有 "gp"的 GAM 更平滑 : how to retrieve the variogram parameters?

r - "gam"插入符号模型不返回fitting.values