对于我的项目,我获取了一个数据集,其中包含 23 列的 1296765 个观测值,我只想随机获取该数据的 10%。我怎样才能在 R 中做到这一点。
我尝试了下面的代码,但它只采样了 10 行。但是,我想随机选择 10% 的数据。我是初学者,请帮忙。
library(dplyr)
x <- sample_n(train, 10)
最佳答案
以下是 dplyr
中的一个函数,它按特定比例随机选择行:
dplyr::slice_sample(train,prop = .1)
关于从 R 中的整个数据集中随机选择 10% 的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/74621815/