c++ - 跨线程扩展 MSVC 2005 的运算符 << 时出现性能问题

在查看我们的一些日志记录时，我在分析器中注意到我们在 operator<< 上花费了大量时间。格式化整数等。看起来有一个共享锁，每当 ostream::operator<< 时都会使用。在格式化 int (并且可能是 double )时调用。经过进一步调查，我将范围缩小到这个例子:

使用 ostringstream 的 Loop1进行格式化:

DWORD WINAPI doWork1(void* param)
{
    int nTimes = *static_cast<int*>(param);
    for (int i = 0; i < nTimes; ++i)
    {
        ostringstream out;
        out << "[0";
        for (int j = 1; j < 100; ++j)
            out << ", " << j; 
        out << "]\n";
    }
    return 0;
}

使用相同的 ostringstream 的 Loop2执行除 int 格式之外的所有操作，这是通过 itoa 完成的:

DWORD WINAPI doWork2(void* param)
{
    int nTimes = *static_cast<int*>(param);
    for (int i = 0; i < nTimes; ++i)
    {
        ostringstream out;
        char buffer[13];
        out << "[0";
        for (int j = 1; j < 100; ++j)
        {
            _itoa_s(j, buffer, 10);
            out << ", " << buffer;
        }
        out << "]\n";
    }
    return 0;
}

在我的测试中，我使用 1、2、3 和 4 个线程多次运行每个循环(我有一台 4 核机器)。试验次数是恒定的。这是输出:

doWork1: all ostringstream
n       Total
1         557
2        8092
3       15916
4       15501

doWork2: use itoa
n       Total
1         200
2         112
3         100
4         105

正如您所看到的，使用 ostringstream 时的性能非常糟糕。当添加更多线程时，情况会变得更糟 30 倍，而 itoa 的速度会快 2 倍。

一个想法是使用_configthreadlocale(_ENABLE_PER_THREAD_LOCALE)根据 M$ in this article 的推荐。这似乎对我没有帮助。 Here's another user谁似乎也有类似的问题。

我们需要能够在应用程序并行运行的多个线程中格式化整数。鉴于这个问题，我们要么需要弄清楚如何使其工作，要么找到另一种格式化解决方案。我可以编写一个简单的类，其中为整型和浮点类型重载了operator<<，然后有一个模板化版本，只在底层流上调用operator<<。有点难看，但我想我可以让它工作，尽管可能不适用于用户定义operator<<(ostream&,T)因为它不是 ostream 。

我还应该明确指出，这是使用 Microsoft Visual Studio 2005 构建的。我相信这个限制来自于他们对标准库的实现。

最佳答案

如果 Visual Studio 2005 的标准库实现有错误，为什么不尝试其他实现呢？喜欢:

甚至Dinkumware Visual Studio 2005 标准库所基于的标准库可能自 2005 年以来就已经解决了该问题。

编辑:您提到的另一位用户使用的是 Visual Studio 2008 SP1，这意味着 Dinkumware 可能尚未修复此问题。

关于c++ - 跨线程扩展 MSVC 2005 的运算符 << 时出现性能问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/1363817/

c++ - 跨线程扩展 MSVC 2005 的运算符 << 时出现性能问题

上一篇：c++ - 使用 OLE 终止 Excel 应用程序

下一篇：c++ - 程序在我的机器上运行 2 秒，但在其他机器上运行 15 秒