R:计算多个变量的行向 lm()

标签 r linear-regression boxplot lm rowwise

如何计算 df 中存储在列中的多个变量的行向 lm()/系数?

我有这种数据(只是例子):

set.seed(1)
foo <- data.frame(trialNumber= 1:10, 
Nr1 = runif(10), 
Nr2 = runif(10), 
Nr3 = runif(10), 
Nr4 = runif(10), 
Nr5 = runif(10), 
Nr6 = runif(10), 
slope = NA)

trialNumber 代表试验中的每一个,我在试验中直接测量了六个值。

我设法使用以下代码通过带箱线图的线性回归线绘制这些数据:

foo_1 <- reshape2::melt(data = foo, id.vars = "trialNumber", measure.vars = c("Nr1", "Nr2", "Nr3", "Nr4", "Nr5", "Nr6"))

p <- ggplot(data = foo_1) + 
  aes(x = variable,
      y = value) + 
  geom_boxplot() + 
  geom_jitter(shape = 1, position = position_jitter(0.1)) +
  ylim(0, NA) + 
  geom_smooth(method = "lm", se = TRUE, formula = y ~ x, aes(group = 1)) 

print(p)

这导致了这张图:

enter image description here

现在这是所有试验的线性回归线,但我希望斜率(或回归系数)按行存储在变量“斜率”中。

最后我想要一个这样的df:

trialnumber | Nr1 | Nr2 | Nr3 | Nr4 | Nr5 | Nr6 | slope
1           | 0.26550866 | 0.2059746|0.93470523|0.4820801|0.8209463|0.47761962|e.g. 0.07
2           | ?   | ?   | ?   | ?   | ?   | ?   |e.g. 3.81
.
.
.

我怎样才能做到这一点?我已经查看了 apply 函数,但我不知道如何使用它。

非常感谢您!

最佳答案

您确实可以只使用apply。这只需要您知道列的索引。我在这里指定了 2:7,但是对于您自己的数据,您可以通过指定例如 grep("Nr", names(foo)) 来获取正确的索引。不过,您需要确保列在数据框中的顺序正确,就像它们在您的示例中一样。

foo$slope <- apply(foo[2:7], 1, function(x) coef(lm(x ~ seq(x)))[2])

foo
#>    trialNumber        Nr1       Nr2        Nr3       Nr4       Nr5        Nr6
#> 1            1 0.26550866 0.2059746 0.93470523 0.4820801 0.8209463 0.47761962
#> 2            2 0.37212390 0.1765568 0.21214252 0.5995658 0.6470602 0.86120948
#> 3            3 0.57285336 0.6870228 0.65167377 0.4935413 0.7829328 0.43809711
#> 4            4 0.90820779 0.3841037 0.12555510 0.1862176 0.5530363 0.24479728
#> 5            5 0.20168193 0.7698414 0.26722067 0.8273733 0.5297196 0.07067905
#> 6            6 0.89838968 0.4976992 0.38611409 0.6684667 0.7893562 0.09946616
#> 7            7 0.94467527 0.7176185 0.01339033 0.7942399 0.0233312 0.31627171
#> 8            8 0.66079779 0.9919061 0.38238796 0.1079436 0.4772301 0.51863426
#> 9            9 0.62911404 0.3800352 0.86969085 0.7237109 0.7323137 0.66200508
#> 10          10 0.06178627 0.7774452 0.34034900 0.4112744 0.6927316 0.40683019
#>          slope
#> 1   0.07008128
#> 2   0.12126747
#> 3  -0.01554811
#> 4  -0.07855978
#> 5  -0.02329221
#> 6  -0.08106554
#> 7  -0.12697229
#> 8  -0.07226543
#> 9   0.03072317
#> 10  0.04405726

关于R:计算多个变量的行向 lm(),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65395805/

相关文章:

r - 如何增加标签名称的字体大小

python - 绘制回归线

excel - 如何使用excel 365在一张图表中显示两条回归趋势线

python - 在 Seaborn 中为 python 创建一个箱线图 FacetGrid

r - 说明 R 中的相对时间线

r - 在某个值之前和之后创建倒计时和计数器

r - 是否有更快的方法来计算 r 中栅格堆栈的中位数?

python - 二次项线性回归

r - 向多个箱线图添加须线(水平线)

r - ggplot geom_jitter 落后于(多个)geom_boxplot