r - 手动泊松回归

标签 r regression estimation poisson log-likelihood

我想手动进行泊松回归并定义一个可用于估计任意数量系数的函数。我有两个问题:

首先:我怎样才能得到一个 beta 矩阵,而不必明确地写下每个 beta。我想以这种方式编写 lambda = exp(t(x)%*%beta) 。我以为我可以做一个 for 循环并为 x 中的每一列创建一个 beta 并将它们加到一个矩阵中,但我不知道如何编码。

第二个: 因为我不知道如何为 i beta 编写代码,所以我尝试编写用于估计 6 beta 的函数。我得到了数据集 warpbreaks 的结果,但系数与 glm 中的不同,为什么?我也不知道我必须将哪些值粘贴到 par,也不知道如果我不将 x 和 y 粘贴到函数,为什么 optim 不起作用。

希望你能帮上忙!

    daten <- warpbreaks

LogLike <- function(y,x, par) {
  beta <- par
  # the deterministic part of the model:
  lambda <- exp(beta%*%t(x))
  # and here comes the negative log-likelihood of the whole dataset, given     the
  # model:
  LL <- -sum(dpois(y, lambda, log = TRUE))
  return(LL)
}


PoisMod<-function(formula, data){

  # #formula
  form <- formula(formula)
  # 
  # # dataFrame 
  model <- model.frame(formula, data = data)
  # 
  # # Designmatrix 
  x <- model.matrix(formula,data = data)
  # 
  # # Response Variable
  y <- model.response(model)

  par <- rep(0,ncol(x))

  call <- match.call()

  koef <- optim(par=par,fn=LogLike,x=x,y=y)$par

 estimation <- return(list("coefficients" = koef,"call"= call))

  class(result) <- "PoisMod"
}


print.PoisMod <- function(x, ...) {  

  # Call 
  cat("Call:", "\n")

  # 
  print(x$call)

  # 
  cat("\n")

  # Coefficients  
  cat("Coefficents:", "\n")

  # 
  Koef <- (t(x$coefficients))

  # 
  rownames(Koef) <- ""

  # 
  print(round(Koef, 3))
}

最佳答案

这是一个工作示例,基于您的代码..但没有解释变量的平方:

LogLike <- function(y,x, par) {
  beta0 <- par[1]
  beta1 <- par[2]
  beta2 <- par[3]
  beta3 <- par[4]
  # the deterministic part of the model:
  lambda <- exp(beta0*x[,1] + beta1 * x[,2] +beta2*x[,3]+beta3*x[,4])
  # and here comes the negative log-likelihood of the whole dataset, given     the
  # model:
  LL <- -sum(dpois(y, lambda, log = TRUE))
  return(LL)
}


PoisMod<-function(formula, data){

  # # definiere Regressionsformel
  form <- formula(formula)
  # 
  # # dataFrame wird erzeugt 
   model <- model.frame(formula, data = data)
  # 
  # # Designmatrix erzeugt
  x <- model.matrix(formula,data = data)
  # 
  # # Response Variable erzeugt
   y <- model.response(model)

  par <- c(0,0,0,0)
  erg <- list(optim(par=par,fn=LogLike,x=x,y=y)$par)
  return(erg)
}

PoisMod(breaks~wool+tension, as.data.frame(daten))

你可以和 glm 比较:

glm(breaks~wool+tension, family = "poisson", data = as.data.frame(daten))

编辑:对于任意数量的解释变量

LogLike <- function(y,x, par) {
  beta <- par
  # the deterministic part of the model:
  lambda <- exp(beta%*%t(x))
  # and here comes the negative log-likelihood of the whole dataset, given     the
  # model:
  LL <- -sum(dpois(y, lambda, log = TRUE))
  return(LL)
}


PoisMod<-function(formula, data){

  # # definiere Regressionsformel
  form <- formula(formula)
  # 
  # # dataFrame wird erzeugt 
   model <- model.frame(formula, data = data)
  # 
  # # Designmatrix erzeugt
  x <- model.matrix(formula,data = data)
  # 
  # # Response Variable erzeugt
   y <- model.response(model)

  par <- rep(0,ncol(x))
  erg <- list(optim(par=par,fn=LogLike,x=x,y=y)$par)
  return(erg)
}

PoisMod(breaks~wool+tension, as.data.frame(daten))
glm(breaks~wool+tension, family = "poisson", data = as.data.frame(daten))

关于r - 手动泊松回归,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48922656/

相关文章:

parameters - 我应该在 GEKKO 中使用估计模式和模拟模式获得相同的结果吗?

python - celery 最好的方式管理/获取任务的eta

r - 将几个参数传递给 lapply 的 FUN(以及其他 *apply)

在 R 中递归应用 lapply

r - 网络 : Making Graph Object from Event-Node Data Using igraph

r - 获取 "mlm"返回的 `lm()`对象的残差标准错误

python - 在 scikit-learn 中实现 R 随机森林特征重要性评分

search - 将 Google/Yahoo 搜索嵌入网站或构建您自己的网站

r - 无法在Rstudio中提取Docker镜像

python - 使用 pymc 解释 MCMC 运行的后验分布