r - 如何构建一个双向表总结 R 中的第三个变量(kable 包)

标签 r cell summary kable kableextra

我正在使用 RMarkdown 并尝试使用 kable 包。我有一个三变量数据框:gender(因子)、age_group(因子)和 test_score(scale)。我想创建双向表,因子变量(性别和年龄组)作为表行和列,test_scores 的汇总统计作为单元格内容。这些汇总统计数据是平均值、标准差和百分位数(中位数、第 1 个十分位数、第 9 个十分位数和第 99 个百分位数)。是否有一种简单的方法可以以漂亮的方式构建这些表(例如使用 kable 包),而无需先将所有这些值输入到矩阵中?我搜索了 kable 帮助文件,但找不到如何操作。

# How my data looks like:

gender <- rep(c(rep(c("M", "F"), each=3)), times=3)
age <- as.factor(rep(seq(10,12, 1), each=6))
score <- c(4,6,8,4,8,9,6,6,9,7,10,13,8,9,13,12,14,16)
testdata <-data.frame(gender,age,score)


| gender | age | score |
|--------|-----|-------|
| M      | 10  | 4     |
| M      | 10  | 6     |
| M      | 10  | 8     |
| F      | 10  | 4     |
| F      | 10  | 8     |
| F      | 10  | 9     |
| M      | 11  | 6     |
| M      | 11  | 6     |
| M      | 11  | 9     |
| F      | 11  | 7     |
| F      | 11  | 10    |
| F      | 11  | 13    |
| M      | 12  | 8     |
| M      | 12  | 9     |
| M      | 12  | 13    |
| F      | 12  | 12    |
| F      | 12  | 14    |
| F      | 12  | 16    |

我想要一个如下所示的表格(但直接从我的数据集计算出来并具有漂亮的发布格式):
      Mean score by gender & age
|        | 10yo | 11yo | 12yo | Total |
|--------|:----:|:----:|:----:|:-----:|
| Male   |   6  |   7  |  10  |  7.7  |
| Female |   7  |  10  |  14  |  10.3 |
| Total  |  6.5 | 88.5 |  12  |   9   |

我尝试使用 kable 包,它确实为我提供了一些漂亮的表(格式很好),但我只能用它生成频率表。但是我找不到任何论据来选择变量摘要。如果有人建议使用更好的软件包来构建上述指定的表格,我将不胜感激。
kable(data, "latex", booktabs = T) %>%
   kable_styling(latex_options = "striped")

最佳答案

如果没有可重现的示例,可以使用 tables::tabular() 创建包含各种统计信息的多路表。功能。

以下是来自 tables 的示例文档,第 38 页,其中说明了打印均值和标准差的表格中的多个变量。

set.seed(1206)

q <- data.frame(p = rep(c("A","B"),each = 10,len = 30), 
                a = rep(c(1,2,3),each = 10),
                id = seq(30),
                b = round(runif(30,10,20)),
                c = round(runif(30,40,70)))
library(tables)
tab <- tabular((Factor(p)*Factor(a)+1) ~ (N = 1) + (b + c) * (mean + sd),
               data = q)
tab[ tab[,1] > 0, ]

输出的 Stackoverflow 友好版本是:
          b           c          
 p a   N  mean  sd    mean  sd   
 A 1   10 14.40 3.026 55.70 6.447
   3   10 14.50 2.877 52.80 8.954
 B 2   10 14.40 2.836 56.30 7.889
   All 30 14.43 2.812 54.93 7.714
>

可以使用 html() 将表格呈现为 HTML。功能。以下代码的输出在 HTML 浏览器中呈现时如下图所示。
html(tab[ tab[,1] > 0, ])

enter image description here
tables包括计算其他统计数据的功能,包括分位数。有关分位数计算的详细信息,请参阅 tables package manual 的第 29 - 30 页。 .

该软件包也适用于 knitr , kable , 和 kableExtra .

关于r - 如何构建一个双向表总结 R 中的第三个变量(kable 包),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61842251/

相关文章:

excel - 复制并粘贴到excel上而不删除单元格当前内容

r - 使用 dplyr 创建多功能描述表

r - 从 r 中的 summary(aov()) 中隔离重要性列

r - 在控制台输出的小标题中显示所有列

R:加速双循环

r - 计算数据串中的某些化学 react

Java 数据结构引用

r - 检查列表中的列是否为 na

uitableview - 以编程方式设置静态单元格的 detailtextlabel

string - 在matlab的单元格中查找字符串(来自表)