r - 如何找到包含因子和 NA 的 R 数据集

标签 r

我正在寻找附加到 R 包的标准数据集,我可以用它来测试代码。我通常使用 iris 或 mtcars ,但它们只有一个因子变量并且没有缺失值。对于具有多个因子变量和 NA 的包/数据集有什么建议,或者如何搜索包含的 R 数据集以获取特定条件?

最佳答案

以下是一种编程方式,可以在包的数据集中搜索您所需的特征:

available_datasets <- data(package='datasets')[['results']][, 3];

meets_reqs <- function(datasets) {
    sapply(datasets, function(ds) {
        dat <- get(sub(" .*", "", ds))
        hasfactors <- "factor" %in% sapply(dat, class)
        nas <- anyNA(dat)
        hasfactors && nas
    })
}

res <- meets_reqs(available_datasets)

res[1:3]
# AirPassengers                BJsales BJsales.lead (BJsales) 
#         FALSE                  FALSE                  FALSE 

res[res]
# attenu
#   TRUE

关于r - 如何找到包含因子和 NA 的 R 数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55307040/

相关文章:

r - 输出表未显示在 R Shiny 应用程序中

r - 在数据表中添加与特定组不同的行的有效方法

r - 使用 R 进行分区和排列

r - 删除所有R不附带的软件包

r - 将标签从 geom_label_repel 移动到 ggplot 边缘

c++ - Rcpp 数值 vector 输出只返回一个值

mysql - R- SQLDF - 选择...案例...结束

r - 水平条形图 : mis-matched axis units

r - 如何在简单的 ggplot2 散点图中干净地标记点?

r - ggplot2 中的 geom_map 边框