r - 系数表在秩缺陷拟合中没有 NA 行;如何插入它们?

标签 r regression permutation linear-regression lm

library(lmPerm)
x <- lmp(formula = a ~ b * c + d + e, data = df, perm = "Prob")

summary(x)  # truncated output, I can see `NA` rows here!

#Coefficients: (1 not defined because of singularities)
#                 Estimate Iter Pr(Prob)
#b                   5.874   51    1.000
#c                -30.060   281    0.263
#b:c                   NA    NA       NA
#d1               -31.333    60    0.633
#d2                33.297   165    0.382
#d3               -19.096    51    1.000
#e                  1.976    NA       NA

我想提取所有内容的 Pr(Prob) 结果,但是

y <- summary(x)$coef[, "Pr(Prob)"]

#(Intercept)           b            c           d1           d2 
# 0.09459459  1.00000000   0.26334520   0.63333333   0.38181818 
#         d3           e 
# 1.00000000          NA 

这不是我想要的。我也需要 b:c 行位于正确的位置。

我想要的上面的输出示例是:

# (Intercept)           b            c    b:c           d1           d2 
#  0.09459459  1.00000000   0.26334520     NA   0.63333333   0.38181818 
#         d3            e 
# 1.00000000           NA 

我还想提取与每个变量对应的 Iter 列。谢谢。

最佳答案

lmp 基于 lmsummary.lmp 的行为也类似于 summary.lm,所以我将首先使用 lm 进行说明,然后表明我们可以对 lmp 执行相同的操作。


lmsummary.lm

阅读 ?summary.lm 并注意以下返回值:

coefficients: a p x 4 matrix with columns for the estimated
              coefficient, its standard error, t-statistic and
              corresponding (two-sided) p-value.  Aliased coefficients are
              omitted.

     aliased: named logical vector showing if the original coefficients are
              aliased.

当您有秩缺陷模型时,系数表中会省略NA系数,它们称为别名变量。考虑以下可重现的小示例:

set.seed(0)
zz <- xx <- rnorm(10)
yy <- rnorm(10)
fit <- lm(yy ~ xx + zz)

coef(fit)  ## we can see `NA` here
#(Intercept)          xx          zz 
#  0.1295147   0.2706560          NA 

a <- summary(fit)  ## it is also printed to screen
#Coefficients: (1 not defined because of singularities)
#            Estimate Std. Error t value Pr(>|t|)
#(Intercept)   0.1295     0.3143   0.412    0.691
#xx            0.2707     0.2669   1.014    0.340
#zz                NA         NA      NA       NA

b <- coef(a)  ## but no `NA` returned in the matrix / table
#             Estimate Std. Error   t value  Pr(>|t|)
#(Intercept) 0.1295147  0.3142758 0.4121051 0.6910837
#xx          0.2706560  0.2669118 1.0140279 0.3402525

d <- a$aliased
#(Intercept)          xx          zz 
#      FALSE       FALSE        TRUE 

如果您想将 NA 行填充到系数表/矩阵,我们可以这样做

## an augmented matrix of `NA`
e <- matrix(nrow = length(d), ncol = ncol(b),
            dimnames = list(names(d), dimnames(b)[[2]]))
## fill rows for non-aliased variables
e[!d] <- b

#             Estimate Std. Error   t value  Pr(>|t|)
#(Intercept) 0.1295147  0.3142758 0.4121051 0.6910837
#xx          0.2706560  0.2669118 1.0140279 0.3402525
#zz                 NA         NA        NA        NA

lmpsummary.lmp

无需更改任何内容。

library(lmPerm)
fit <- lmp(yy ~ xx + zz, perm = "Prob")
a <- summary(fit)  ## `summary.lmp`
b <- coef(a)

#              Estimate Iter  Pr(Prob)
#(Intercept) -0.0264354  241 0.2946058
#xx           0.2706560  241 0.2946058

d <- a$aliased
#(Intercept)          xx          zz 
#      FALSE       FALSE        TRUE 

e <- matrix(nrow = length(d), ncol = ncol(b),
            dimnames = list(names(d), dimnames(b)[[2]]))
e[!d] <- b

#              Estimate Iter  Pr(Prob)
#(Intercept) -0.0264354  241 0.2946058
#xx           0.2706560  241 0.2946058
#zz                  NA   NA        NA

如果您想提取 IterPr(Prob),只需这样做

e[, 2]  ## e[, "Iter"]
#(Intercept)          xx          zz 
#        241         241          NA 

e[, 3]  ## e[, "Pr(Prob)"]
#(Intercept)          xx          zz 
#  0.2946058   0.2946058          NA 

关于r - 系数表在秩缺陷拟合中没有 NA 行;如何插入它们?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40844853/

相关文章:

r - 对按因子拆分的数据帧中的许多列应用 t 检验

r - 提取列标题

r - 如何在 R 中创建显示预测模型、数据和残差的图表

python - 从按钮 x 开始,在按钮 y 结束,z 号码长的电话号码排列

algorithm - 如何计算顺序重要且集合长度不同的排列?

r - for 循环 - 替换的长度为零

arrays - 如何减少R中数组的维数

r - 如何在 R 中的 cloglog 回归中添加随机和/或固定效应

r - 图(glm.out)使用错误类型的残差来绘制比例位置图?

python - 使用 Python 生成两个字符串的组合