r - 创建一个带有循环方差分析结果的表 r

标签 r statistics anova ancova

数据框示例:

>

 df
    ID B C D
  1  A  1  1  3
  2  B  2  3  1
  3  C  1  1  1
  4  D  3  1  1
  5  E  1  0  0

我已经使用此代码(在线找到)对数据框上的各种变量进行了方差分析

数据:df

library(car)
LLA <- rep(NA, ncol (df))
sink("dfresults.doc")
for (i in 4:ncol(df)) {
  column <- names(df[i])
  contrasts(df$Group)<-contr.helmert(2) 
  contrasts(df$Gender)<-contr.helmert(2) 
  model= aov(df[,i] ~ Group + Gender, data= df)
  SBCna=Anova(model, type="III")
  tk=TukeyHSD(aov(df[,i] ~ Group + Gender, data= df))
  print(column)
  print(LLA)
  print(tk)
}
sink()

(组和性别都是阶乘) 这生成了一个包含分析输出的 .doc 文件(非常有用),输出示例:

    [1] "variable"
Anova Table (Type III tests)

Response: df[, i]
              Sum Sq  Df   F value    Pr(>F)    
(Intercept) 14313489   1 6922.5653 < 2.2e-16 ***
Group            280   1    0.1354    0.7133    
Gender         40487   1   19.5809 1.635e-05 ***
Residuals     386652 187                        
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = df[, i] ~ Group + Gender, data =df)

$Group
                  diff       lwr      upr    p adj
Group1-Group2 0.09016515 -14.99211 15.17244 0.990603

$Gender
                diff      lwr      upr    p adj
Male-Female 32.62016 18.02386 47.21646 1.75e-05

现在我想做的是使用 Sum f Square、f Value、P 值(Pr(>F))从输出中生成的方差分析表。

最佳答案

假设您的数据框是这样的:

df = data.frame(id=1:100,
Group=sample(letters[1:2],100,replace=TRUE),
Gender=sample(c("M","F"),100,replace=TRUE),
matrix(rnorm(7*100),ncol=7))
colnames(df)[4:10] = paste0("Var",1:7)
contrasts(df$Group)<-contr.helmert(2) 
contrasts(df$Gender)<-contr.helmert(2) 

然后一种快速的方法是将 AOV 结果存储在列表中,并且您只需使用 aov 拟合一次模型,然后再次使用 Anova。

Variables_to_regress = colnames(df)[4:ncol(df)]
anova_results = vector("list",length(Variables_to_regress))
names(anova_results) = Variables_to_regress

for (i in Variables_to_regress) {
  this_formula = as.formula(paste(i,"~ Group + Gender"))
  model = aov(formula=this_formula, data=df)
  anova_results[[i]] = Anova(model, data=df,type="III")
}

data.frame(anova_results[["Var1"]])
                  Sum.Sq Df     F.value    Pr..F.
(Intercept) 1.326132e-03  1 0.001214224 0.9722744
Group       2.818789e-01  1 0.258091920 0.6125874
Gender      7.351722e-01  1 0.673133183 0.4139730
Residuals   1.059400e+02 97          NA        NA

write.csv(data.frame(anova_results[["Var1"]]),....)

如果你有兴趣,另一种方法是使用 purrr 和 broom 来收集所有的回归结果:

library(purrr)
library(broom)
library(tidyr)

res = pivot_longer(df[,-1],-c(Group,Gender)) %>%
nest(data=c(Group, Gender, value)) %>% 
mutate(
fit=map(data,~aov(value ~ Group+Gender,data=.x)),
typeIII = map(fit,Anova,type="III"),
tidied = map(typeIII,tidy)
)

上面的代码基本上将您的数据转换为长格式,将下面的所有内容集中到一个变量中,执行 aov、方差分析并使用 broom 中的 tidy 清理表格。上面的方法很有用,您可以轻松扩展它以执行更多测试,或查看方差分析结果中的其他统计数据。

要只查看结果,请执行以下操作:

res %>% unnest(tidied) %>% select(name,term,sumsq,df,statistic,p.value)
# A tibble: 28 x 6
   name  term            sumsq    df statistic p.value
   <chr> <chr>           <dbl> <dbl>     <dbl>   <dbl>
 1 Var1  (Intercept)   0.00133     1   0.00121   0.972
 2 Var1  Group         0.282       1   0.258     0.613
 3 Var1  Gender        0.735       1   0.673     0.414
 4 Var1  Residuals   106.         97  NA        NA    
 5 Var2  (Intercept)   1.32        1   1.04      0.311
 6 Var2  Group         0.102       1   0.0798    0.778
 7 Var2  Gender        1.63        1   1.28      0.261
 8 Var2  Residuals   124.         97  NA        NA    
 9 Var3  (Intercept)   0.0625      1   0.0649    0.799
10 Var3  Group         0.247       1   0.256     0.614

关于r - 创建一个带有循环方差分析结果的表 r,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60702814/

相关文章:

algorithm - 将一组线段近似为一条最佳拟合直线

python - NLTK 中的内置词性标注器对其决策是否具有置信度值?

r - Anova 表比较组,在 R 中,导出到 latex ?

r - 不平衡数据集上的 2 向方差分析

r - 根据前一行中多个变量的值对行进行条件过滤

r - 如何从 glm 对象获取 Z - 统计的值?

r - 帮助奇数plyr/doSMP警告

r - 按R中的所有列对数据框进行排序

algorithm - 了解 MATLAB 中的 knn 算法(分类)

r - R : Dataframe selection 中的方差分析