c++ - STL模板的特化

标签 c++ c++11 templates visual-c++ stl

我正在尝试使用 Mersenne Twister 编写使用随机数的高性能代码。大约需要 ~5ns生成随机 unsigned long long .这用于生成 double ,但是,这些需要 ~40ns在分布中生成。

查看STL代码double由分布生成的 s 是通过调用 std::generate_canonical 生成的,其中涉及 std::ceilstd::log2操作,我相信是这些是成本高昂的。

这些操作是不必要的,因为它们用于计算调用任何 RNG 实现所需的位数。因为这是在编译时间之前已知的,所以我编写了自己的实现,不进行这些调用,并且生成 double 的时间。是~15ns .

是否可以特化一个模板化的 STL 函数?如果是这样,这是如何实现的,到目前为止,我的尝试导致原始功能仍在使用。我想专门研究这个 STL 函数,因为我仍然想使用 <random> 中的分布.

这是在 Visual C++ 中进行的,但是一旦代码开发完成,它将在 Linux 上运行并使用 GCC 或 ICC。如果在 Linux 上生成 double 的方法不同(并且更快),则此问题无关紧要。

编辑 1:

我相信所有发行版都需要对 std::generate_canonical 进行两次调用,此函数在 [0,1) 范围内创建一个 double ,并通过迭代添加对 RNG operator() 的调用来创建正确的精度. log2ceil用于计算迭代次数。

MSVC std::generate_canonical

// FUNCTION TEMPLATE generate_canonical
template<class _Real,
size_t _Bits,
class _Gen>
_Real generate_canonical(_Gen& _Gx)
{   // build a floating-point value from random sequence
_RNG_REQUIRE_REALTYPE(generate_canonical, _Real);

const size_t _Digits = static_cast<size_t>(numeric_limits<_Real>::digits);
const size_t _Minbits = _Digits < _Bits ? _Digits : _Bits;

const _Real _Gxmin = static_cast<_Real>((_Gx.min)());
const _Real _Gxmax = static_cast<_Real>((_Gx.max)());
const _Real _Rx = (_Gxmax - _Gxmin) + static_cast<_Real>(1);

const int _Ceil = static_cast<int>(_STD ceil(
    static_cast<_Real>(_Minbits) / _STD log2(_Rx)));
const int _Kx = _Ceil < 1 ? 1 : _Ceil;

_Real _Ans = static_cast<_Real>(0);
_Real _Factor = static_cast<_Real>(1);

for (int _Idx = 0; _Idx < _Kx; ++_Idx)
    {   // add in another set of bits
    _Ans += (static_cast<_Real>(_Gx()) - _Gxmin) * _Factor;
    _Factor *= _Rx;
    }

return (_Ans / _Factor);
}

我的简化版

template<size_t _Bits>
double generate_canonical(std::mt19937_64& _Gx)
{   // build a floating-point value from random sequence
    const double _Gxmin = static_cast<double>((_Gx.min)());
    const double _Gxmax = static_cast<double>((_Gx.max)());
    const double _Rx = (_Gxmax - _Gxmin) + static_cast<double>(1);

    double _Ans = (static_cast<double>(_Gx()) - _Gxmin);

    return (_Ans / _Rx);
}

这个函数写在namespace std {}

编辑 2:

我找到了解决方案,请在下面查看我的回答。

最佳答案

抱歉,不允许特化标准库函数;这样做会导致未定义的行为。

但是,您可以使用其他发行版; C++ 在生成器和分布之间有明确定义的接口(interface)。

哦,只是为了消除初学者错误的可能性(因为您没有显示代码):您不要为每个数字创建一个新的分布。

关于c++ - STL模板的特化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51444434/

相关文章:

templates - 绑定(bind)到兄弟元素

c++ - CLion (C++) - 无匹配函数

c++ - 完美转发可变模板参数到成员函数

c++ - 如何在 Visual Studio 2005 及更高版本中自动更改项目设置

c++ - 通过 'tuple' 和 'tie' 实现比较运算符,好主意吗?

html - 将 HTML 插入到 golang 模板

c++ - 为什么在 "getline"之后使用 "cin"时需要 cin.ignore() 而在多次使用 "cin"时不需要?

c++ - 使用常量成员移动类的构造和赋值

C++ lambda - 捕获成员变量

javascript - 如何在 dojo 1.8 中模板化嵌套对象数组?