数据集子集的回归

标签 r linear-regression

我想做以下事情并需要一些帮助:

分别为“年龄”[lm(Height~Age)]计算“高度”的斜率和截距

(A) 每个个体

(二)性别

并创建一个包含结果(斜率和截距)的表格。我可以为此使用“申请”吗?

在下一步中,我想进行统计测试以确定性别之间的斜率和截距是否存在显着差异。我知道如何在 R 中进行测试,但也许有一种方法可以将斜率/截距计算和 T 测试结合起来。

示例数据:

example = data.frame(Age = c(1, 3, 6, 9, 12,
                             1, 3, 6, 9, 12,
                             1, 3, 6, 9, 12,
                             1, 3, 6, 9, 12), 
                Individual = c("Jack", "Jack", "Jack", "Jack", "Jack",
                               "Jill", "Jill", "Jill", "Jill", "Jill",
                               "Tony", "Tony", "Tony", "Tony", "Tony",
                               "Jen", "Jen", "Jen", "Jen","Jen"),
                    Gender = c("M", "M", "M", "M", "M",
                               "F", "F", "F", "F", "F",
                               "M", "M", "M", "M", "M",
                               "F", "F", "F", "F", "F"),
                    Height = c(38, 62, 92, 119, 165,
                               31, 59, 87, 118, 170,
                               45, 72, 93, 155, 171,
                               33, 61, 92, 115, 168))

最佳答案

对每个级别分别进行回归分析然后在数据框中组合斜率和截距的一种方法是使用函数 ddply()来自图书馆plyr .

library(plyr)

ddply(example,"Individual",function(x) coefficients(lm(Height~Age,x)))
  Individual (Intercept)      Age
1       Jack    26.29188 11.11421
2        Jen    22.10660 11.56345
3       Jill    18.33249 12.04315
4       Tony    33.02030 11.96447

ddply(example,"Gender",function(x) coefficients(lm(Height~Age,x)))
  Gender (Intercept)      Age
1      F    20.21954 11.80330
2      M    29.65609 11.53934

关于数据集子集的回归,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14471351/

相关文章:

r - 带垂直线的散点图 - Lollipop 图

javascript - 是否可以将数据发送到 Shiny 的应用程序?

r - 如何在 R 中用因子值(如 y)做 ggplot barplot?

python-3.x - 如何修复当我尝试在终端上运行构建图时弹出的张量板错误

python - 如何执行多条曲线的联合拟合(在 Python 中)?

r - lme4::lmer报告 “fixed-effect model matrix is rank deficient”,我是否需要修复以及如何解决?

r - 使用 R 删除特定变量中不包含 .(点)的行

r - 确定 data.table 组成员的行索引

c - 在 C 中使用 dgsev 时获取不正确的值

r - 避免在拟合多个线性回归模型时重复编写模型公式