r - 如何每次从数据集中取相同的随机样本

标签 r random random-seed

我有一个包含近 700 万个观察值的数据集，我想随机抽取数据样本来分析其中的一个子集。我知道如何随机抽样数据:

index <- sample(7009728, 50000)
flights <- flight[index, ]

有没有一种方法可以获取随机样本，但一旦在我的数据集中创建，总是给我相同的随机样本？我希望不必依赖于保存我的 R 项目就可以做到这一点。

最佳答案

只需在创建索引之前使用 set.seed:

> set.seed(1)
> index <- sample(7009728, 50000)
> head(index)
[1] 1861144 2608487 4015546 6366287 1413735 6297463

它设置随机数生成器种子并确保一致的结果。

关于r - 如何每次从数据集中取相同的随机样本，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30698972/

上一篇：google-bigquery - 如何在 GitHub-Archive 中获取具有最大星数的 java 存储库

下一篇：Scala:以编程方式设置断点以供 IntelliJ 识别

相关文章：

c - 在只需要 1 位的情况下充分利用 256 个随机位

random - 随机函数中不可预测的含义是什么？

c++ - 如何打印与单词 Arduino 相关的变量？

r - H2O 中的自定义损失函数

postgresql - foreach %dopar% + RPostgreSQL 的

java - 如何在 java 中生成所有可能的 64 位随机值？

c++ - 给每个给定的自然数分配一个随机自然数

r - 聚合方法以不同方式处理缺失值 (NA)

c++ - 无法编译R包

c++ - C++中从-9到9的随机数

©2024 IT工具网联系我们