r - 在 dplyr, R 中抽取没有组的样本

标签 r random dplyr sample-data

我知道如何使用 dplyr 中的sample_n或sample_frac从数据帧中的每组中抽取随机样本,可以像这样,

dataset %>%
  group_by(user_id) %>%
  sample_n(10)

但是,我有一个稍微不同的问题。我想从整个数据集中随机抽取一个样本。应该就这么简单,

sample_n(dataset,10)

但是,因为我在之前的案例中对数据集使用了group_by命令,所以group_by在这里似乎仍然有效。这里第二个命令与第一个命令等效。

我想知道如何消除 group_by 的影响并从整个数据集中获取随机样本?

最佳答案

我们可以使用ungroup()删除任何组变量,然后应用sample_n

dataset %>%
    group_by(user_id)  %>%
    ungroup() %>%
    sample_n(10)

关于r - 在 dplyr, R 中抽取没有组的样本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39011246/

相关文章:

java - 我的 Runner 使用 Handler 无法在 Android 上运行

r - 在 dplyr 中按组获取总和后计算列的行百分比

r - 使用dplyr时使用rle按运行分组

mysql - 来自 Sql 数据库的简单随机样本

c# - iOS 版 SQLite - RANDOM() 不够好

r - 如何防止 RMySQL 警告 "Unsigned INTEGER in col imported as numeric"?

python - 将rpy模块导入python

r - 为 R 中的 N、Min/Max、SD、Mean 和 Median 创建一个表

r - 在 tidygraph 中过滤

r - 查找字符串中未使用的字符