我有一个具有未知值的分类变量(种族),我尝试用 gtsummary 呈现它,以便分别计算已知值和未知值的比例
我已经成功到达this stage
但是我找不到单独计算缺失值比例的方法
我的代码是这样的
trial %>%
select(age, response, trt) %>%
tbl_summary(
by = trt,
missing = "if_any",
statistic = list(all_continuous() ~ "{mean} ({sd})",
response~ c("{n} ({p}%)",
"{N_miss} ({p_miss})"),
all_categorical() ~ "{n} ({p}%)"),
)
我确实尝试了建议的解决方案 here (即 fct_replace_na
并设置 missing = "no"
),但它仍然在总体比例中包含未知行
谢谢
最佳答案
这是一个很好的问题,我认为我应该实现一些措施来使这变得更容易。无论如何,我将这样做: 1. 定义一个新变量,指示该变量是否丢失。 2. 在表中汇总此变量并将默认标签更新为“未知”,3. 缩进缺少的行。
下面的例子!
library(gtsummary)
library(dplyr, warn.conflicts = FALSE)
packageVersion("gtsummary")
#> [1] '1.6.0'
tbl <-
trial %>%
mutate(across(c(age, response), is.na, .names = "{.col}_missing")) %>%
select(age, age_missing, response, response_missing, trt) %>%
tbl_summary(
by = trt,
missing = "no",
label = ends_with("_missing") ~ "Unknown",
statistic = list(all_continuous() ~ "{mean} ({sd})",
response~ c("{n} ({p}%)",
"{N_miss} ({p_miss})"),
all_categorical() ~ "{n} ({p}%)"),
) %>%
modify_column_indent(columns = label, rows = endsWith(variable, "_missing"))
由reprex package于2022年4月27日创建(v2.0.1)
关于r - gtsummary - 分别呈现未知/缺失值的比例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72030309/