我正在尝试使用 Mersenne Twister 编写使用随机数的高性能代码。大约需要 ~5ns
生成随机 unsigned long long
.这用于生成 double
,但是,这些需要 ~40ns
在分布中生成。
查看STL代码double
由分布生成的 s 是通过调用 std::generate_canonical
生成的,其中涉及 std::ceil
和 std::log2
操作,我相信是这些是成本高昂的。
这些操作是不必要的,因为它们用于计算调用任何 RNG 实现所需的位数。因为这是在编译时间之前已知的,所以我编写了自己的实现,不进行这些调用,并且生成 double
的时间。是~15ns
.
是否可以特化一个模板化的 STL 函数?如果是这样,这是如何实现的,到目前为止,我的尝试导致原始功能仍在使用。我想专门研究这个 STL 函数,因为我仍然想使用 <random>
中的分布.
这是在 Visual C++ 中进行的,但是一旦代码开发完成,它将在 Linux 上运行并使用 GCC 或 ICC。如果在 Linux 上生成 double 的方法不同(并且更快),则此问题无关紧要。
编辑 1:
我相信所有发行版都需要对 std::generate_canonical
进行两次调用,此函数在 [0,1) 范围内创建一个 double ,并通过迭代添加对 RNG operator()
的调用来创建正确的精度. log2
和 ceil
用于计算迭代次数。
MSVC std::generate_canonical
// FUNCTION TEMPLATE generate_canonical
template<class _Real,
size_t _Bits,
class _Gen>
_Real generate_canonical(_Gen& _Gx)
{ // build a floating-point value from random sequence
_RNG_REQUIRE_REALTYPE(generate_canonical, _Real);
const size_t _Digits = static_cast<size_t>(numeric_limits<_Real>::digits);
const size_t _Minbits = _Digits < _Bits ? _Digits : _Bits;
const _Real _Gxmin = static_cast<_Real>((_Gx.min)());
const _Real _Gxmax = static_cast<_Real>((_Gx.max)());
const _Real _Rx = (_Gxmax - _Gxmin) + static_cast<_Real>(1);
const int _Ceil = static_cast<int>(_STD ceil(
static_cast<_Real>(_Minbits) / _STD log2(_Rx)));
const int _Kx = _Ceil < 1 ? 1 : _Ceil;
_Real _Ans = static_cast<_Real>(0);
_Real _Factor = static_cast<_Real>(1);
for (int _Idx = 0; _Idx < _Kx; ++_Idx)
{ // add in another set of bits
_Ans += (static_cast<_Real>(_Gx()) - _Gxmin) * _Factor;
_Factor *= _Rx;
}
return (_Ans / _Factor);
}
我的简化版
template<size_t _Bits>
double generate_canonical(std::mt19937_64& _Gx)
{ // build a floating-point value from random sequence
const double _Gxmin = static_cast<double>((_Gx.min)());
const double _Gxmax = static_cast<double>((_Gx.max)());
const double _Rx = (_Gxmax - _Gxmin) + static_cast<double>(1);
double _Ans = (static_cast<double>(_Gx()) - _Gxmin);
return (_Ans / _Rx);
}
这个函数写在namespace std {}
编辑 2:
我找到了解决方案,请在下面查看我的回答。
最佳答案
抱歉,不允许特化标准库函数;这样做会导致未定义的行为。
但是,您可以使用其他发行版; C++ 在生成器和分布之间有明确定义的接口(interface)。
哦,只是为了消除初学者错误的可能性(因为您没有显示代码):您不要为每个数字创建一个新的分布。
关于c++ - STL模板的特化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51444434/