从 R 中的整个数据集中随机选择 10% 的数据

标签 r dplyr

对于我的项目,我获取了一个数据集,其中包含 23 列的 1296765 个观测值,我只想随机获取该数据的 10%。我怎样才能在 R 中做到这一点。

我尝试了下面的代码,但它只采样了 10 行。但是,我想随机选择 10% 的数据。我是初学者,请帮忙。

library(dplyr)  
x <- sample_n(train, 10)

最佳答案

以下是 dplyr 中的一个函数,它按特定比例随机选择行:

dplyr::slice_sample(train,prop = .1) 

关于从 R 中的整个数据集中随机选择 10% 的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/74621815/

相关文章:

R - 搜索数字序列

r - 如何更改 ggplot geom_histogram() 中的直方图边界线厚度

R:从图中镜像 y 轴

r - dplyr 使用汇总时只返回一行

r - 使用 dplyr/dbplyr 添加 postgres 时间间隔

r - 参数默认为 "."的 dplyr 函数

r - 从 r 包中提取源代码

r - 如何重新投影诸如 "wrld_simpl"之类的 map ?

r - 使用 'select' 库中的 'dplyr' 函数选择唯一值

在 R session 中删除/分离包