我正在寻找附加到 R 包的标准数据集,我可以用它来测试代码。我通常使用 iris 或 mtcars ,但它们只有一个因子变量并且没有缺失值。对于具有多个因子变量和 NA 的包/数据集有什么建议,或者如何搜索包含的 R 数据集以获取特定条件?
最佳答案
以下是一种编程方式,可以在包的数据集中搜索您所需的特征:
available_datasets <- data(package='datasets')[['results']][, 3];
meets_reqs <- function(datasets) {
sapply(datasets, function(ds) {
dat <- get(sub(" .*", "", ds))
hasfactors <- "factor" %in% sapply(dat, class)
nas <- anyNA(dat)
hasfactors && nas
})
}
res <- meets_reqs(available_datasets)
res[1:3]
# AirPassengers BJsales BJsales.lead (BJsales)
# FALSE FALSE FALSE
res[res]
# attenu
# TRUE
关于r - 如何找到包含因子和 NA 的 R 数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55307040/