c++ - 如何简洁、便携、彻底地播种mt19937 PRNG?

标签 c++ c++11 random

我似乎看到很多答案有人建议使用 <random>生成随机数,通常伴随着这样的代码:

std::random_device rd;  
std::mt19937 gen(rd());
std::uniform_int_distribution<> dis(0, 5);
dis(gen);

通常这会取代某种“邪恶的可憎之物”,例如:

srand(time(NULL));
rand()%6;

我们可能 criticize争论的老方法 time(NULL)提供低熵,time(NULL)是可预测的,最终结果是不均匀的。

但所有这些都适用于新方法:它只是有一个更 Shiny 的表面。

  • rd()返回单个 unsigned int .这至少有 16 位,可能有 32 位。这不足以播种 MT 的 19937 位状态。

  • 使用 std::mt19937 gen(rd());gen() (用 32 位播种并查看第一个输出)没有提供良好的输出分布。 7 和 13 永远不可能是第一个输出。两个种子产生 0。十二个种子产生 1226181350。( Link )

  • std::random_device可以,有时是,实现为具有固定种子的简单 PRNG。因此,它可能会在每次运行时产生相同的序列。 ( Link ) 这比 time(NULL) 还要糟糕.

更糟糕的是,复制和粘贴上述代码片段非常容易,尽管它们包含问题。一些解决方案需要获取 largish libraries这可能并不适合所有人。

鉴于此,我的问题是如何在 C++ 中简洁、可移植和彻底地播种 mt19937 PRNG?

鉴于上述问题,一个很好的答案:

  • 必须完全播种 mt19937/mt19937_64。
  • 不能完全依赖std::random_devicetime(NULL)作为熵的来源。
  • 不应依赖 Boost 或其他库。
  • 应该适合少量的行,以便将其复制粘贴到答案中看起来不错。

想法

  • 我目前的想法是 std::random_device 的输出可以与 time(NULL) 混合(可能通过 XOR) , 来自 address space randomization 的值,以及一个硬编码常量(可以在分发期间设置)以获得熵的最大努力。

  • std::random_device::entropy() does not很好地说明什么 std::random_device可能会也可能不会。

最佳答案

我认为 std::random_device 的最大缺陷是,如果没有可用的 CSPRNG,则允许确定性回退。这本身就是不使用 std::random_device 为 PRNG 播种的一个很好的理由,因为产生的字节可能是确定性的。不幸的是,它没有提供 API 来查明这种情况何时发生,或者请求失败而不是低质量的随机数。

也就是说,没有完全可移植的解决方案:但是,有一个体面的、最小的方法。您可以使用围绕 CSPRNG 的最小包装器(定义为下面的 sysrandom)来播种 PRNG。

window


您可以依赖 CryptGenRandom,一个 CSPRNG。例如,您可以使用以下代码:

bool acquire_context(HCRYPTPROV *ctx)
{
    if (!CryptAcquireContext(ctx, nullptr, nullptr, PROV_RSA_FULL, 0)) {
        return CryptAcquireContext(ctx, nullptr, nullptr, PROV_RSA_FULL, CRYPT_NEWKEYSET);
    }
    return true;
}


size_t sysrandom(void* dst, size_t dstlen)
{
    HCRYPTPROV ctx;
    if (!acquire_context(&ctx)) {
        throw std::runtime_error("Unable to initialize Win32 crypt library.");
    }

    BYTE* buffer = reinterpret_cast<BYTE*>(dst);
    if(!CryptGenRandom(ctx, dstlen, buffer)) {
        throw std::runtime_error("Unable to generate random bytes.");
    }

    if (!CryptReleaseContext(ctx, 0)) {
        throw std::runtime_error("Unable to release Win32 crypt library.");
    }

    return dstlen;
}

类 Unix


在许多类 Unix 系统上,您应该使用 /dev/urandom可能时(尽管不能保证在符合 POSIX 的系统上存在)。

size_t sysrandom(void* dst, size_t dstlen)
{
    char* buffer = reinterpret_cast<char*>(dst);
    std::ifstream stream("/dev/urandom", std::ios_base::binary | std::ios_base::in);
    stream.read(buffer, dstlen);

    return dstlen;
}

其他


如果没有可用的 CSPRNG,您可以选择依赖 std::random_device。但是,如果可能的话,我会避免这种情况,因为各种编译器(最著名的是 MinGW)将其实现为 PRNG。 (事实上​​ ,每次都产生相同的序列以提醒人们它不是随机的)。

播种


现在我们的部分开销最小,我们可以生成所需的随机熵位来为我们的 PRNG 播种。该示例使用(显然不够)32 位作为 PRNG 的种子,您应该增加此值(这取决于您的 CSPRNG)。

std::uint_least32_t seed;    
sysrandom(&seed, sizeof(seed));
std::mt19937 gen(seed);

提升比较


在快速查看 source code 之后,我们可以看到与 boost::random_device(一个真正的 CSPRNG)的相似之处. Boost 在 Windows 上使用 MS_DEF_PROV,这是 PROV_RSA_FULL 的提供程序类型。唯一缺少的是验证加密上下文,这可以通过 CRYPT_VERIFYCONTEXT 完成。在 *Nix 上,Boost 使用 /dev/urandom。 IE,此解决方案便携、经过充分测试且易于使用。

Linux 特化


如果您愿意为了安全而牺牲简洁性,getrandom在 Linux 3.17 及更高版本以及最近的 Solaris 上是一个很好的选择。 getrandom 的行为与 /dev/urandom 相同,除了它会在内核启动后尚未初始化其 CSPRNG 时阻塞。以下代码片段检测 Linux getrandom 是否可用,如果不可用则返回到 /dev/urandom

#if defined(__linux__) || defined(linux) || defined(__linux)
#   // Check the kernel version. `getrandom` is only Linux 3.17 and above.
#   include <linux/version.h>
#   if LINUX_VERSION_CODE >= KERNEL_VERSION(3,17,0)
#       define HAVE_GETRANDOM
#   endif
#endif

// also requires glibc 2.25 for the libc wrapper
#if defined(HAVE_GETRANDOM)
#   include <sys/syscall.h>
#   include <linux/random.h>

size_t sysrandom(void* dst, size_t dstlen)
{
    int bytes = syscall(SYS_getrandom, dst, dstlen, 0);
    if (bytes != dstlen) {
        throw std::runtime_error("Unable to read N bytes from CSPRNG.");
    }

    return dstlen;
}

#elif defined(_WIN32)

// Windows sysrandom here.

#else

// POSIX sysrandom here.

#endif

OpenBSD


最后一个警告:现代 OpenBSD 没有 /dev/urandom。你应该使用 getentropy相反。

#if defined(__OpenBSD__)
#   define HAVE_GETENTROPY
#endif

#if defined(HAVE_GETENTROPY)
#   include <unistd.h>

size_t sysrandom(void* dst, size_t dstlen)
{
    int bytes = getentropy(dst, dstlen);
    if (bytes != dstlen) {
        throw std::runtime_error("Unable to read N bytes from CSPRNG.");
    }

    return dstlen;
}

#endif

其他想法


如果您需要加密安全的随机字节,您应该用 POSIX 的无缓冲打开/读取/关闭替换 fstream。这是因为 basic_filebufFILE 都包含一个内部缓冲区,它将通过标准分配器分配(因此不会从内存中删除)。

这可以很容易地通过将 sysrandom 更改为:

size_t sysrandom(void* dst, size_t dstlen)
{
    int fd = open("/dev/urandom", O_RDONLY);
    if (fd == -1) {
        throw std::runtime_error("Unable to open /dev/urandom.");
    }
    if (read(fd, dst, dstlen) != dstlen) {
        close(fd);
        throw std::runtime_error("Unable to read N bytes from CSPRNG.");
    }

    close(fd);
    return dstlen;
}

谢谢


特别感谢 Ben Voigt 指出 FILE 使用缓冲读取,因此不应使用。

我还要感谢 Peter Cordes 提到 getrandom,以及 OpenBSD 缺少 /dev/urandom

关于c++ - 如何简洁、便携、彻底地播种mt19937 PRNG?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46595287/

相关文章:

c++ - 如何用不同类型的迭代器填充 vector ?

c++ - 如何在给定范围内找到 std::set< pair<int, int>> 中的最大值?

javascript - 如何生成随机素数?

c++ - 两个8位数组协方差的快速实现

c++ - C/C++ Unix配置文件库

c++ - 为什么可以存在两个仅在返回常量上有所不同的隐式转换?

C++11 暂停执行一定时间的最准确方法?

c++11:模板参数中为空

c - 我自己的随机数生成器

objective-c - Objective-C 中的非重复随机数