我注意到许多 R 模型允许“权重”参数(例如 cart、loess、gam,...)。大多数帮助函数将其描述为数据的“先验权重”,但这实际上意味着什么?
我有包含许多重复案例和二进制响应的数据。我希望我可以使用“权重”来编码输入和响应的每种组合发生的次数,但这似乎不起作用。我还尝试将成功的比例作为响应,并为每个协变量组合的总试验权重,但这似乎也不起作用(至少对于 gam 来说)。我正在尝试对上面列出的所有模型类型执行此操作,但对于初学者来说,如何对 gam [mgcv 包] 执行此操作?
最佳答案
二项式响应的权重有一个自然的解释:每个观察值对应的试验次数。如果您进行了 n
次试验,其中 p
取得了成功,则可以将其与
glm(p/n ~ x, family=binomial, weights=n)
对于 gam
和 mgcv
包中的 gam
也同样适用。
关于r - 在 R 中对重复情况使用权重(特别是二元响应的 gam),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17752502/