c# - 在这种情况下，为什么 .NET 比 C++ 快？

确保在 IDE 之外运行。这是关键。

-edit-我喜欢 SLaks 的评论。 “这些答案中的错误信息数量惊人。” :D

冷静下来，伙计们。几乎所有人都错了。我确实进行了优化。 ~~事实证明，我所做的任何优化都不够好。~~ 我使用 gettimeofday 在 GCC 中运行代码(我将在下面粘贴代码)并使用 g++ -O2 file.cpp 并获得比 C# 稍快的结果。 ~~也许 MS 没有在这种特定情况下创建所需的优化，但在下载和安装 mingw 后，我经过测试发现速度几乎相同。~~ Justicle似乎是对的。我本可以发誓我在我的电脑上使用时钟并用它来计数，发现它速度较慢但问题解决了。在 MS 编译器中，C++ 的速度几乎没有慢两倍。

当我的 friend 告诉我这件事时，我简直不敢相信。所以我拿了他的代码并在上面放了一些计时器。

而不是 Boo我用 C#。我在 C# 中不断得到更快的结果。为什么？无论我使用什么数字，.NET 版本的时间几乎都是一半。

C++ 版本(坏版本):

#include <iostream>
#include <stdio.h>
#include <intrin.h>
#include <windows.h>
using namespace std;

int fib(int n)
{
    if (n < 2) return n;
    return fib(n - 1) + fib(n - 2);
}

int main()
{
    __int64 time = 0xFFFFFFFF;
    while (1)
    {
        int n;
        //cin >> n;
        n = 41;
        if (n < 0) break;
__int64 start = __rdtsc();
        int res = fib(n);
__int64 end = __rdtsc();
        cout << res << endl;
        cout << (float)(end-start)/1000000<<endl;
        break;
    }

    return 0;
}

C++ 版本(更好的版本):

#include <iostream>
#include <stdio.h>
#include <intrin.h>
#include <windows.h>
using namespace std;

int fib(int n)
{
    if (n < 2) return n;
    return fib(n - 1) + fib(n - 2);
}

int main()
{
    __int64 time = 0xFFFFFFFF;
    while (1)
    {
        int n;
        //cin >> n;
        n = 41;
        if (n < 0) break;
        LARGE_INTEGER start, end, delta, freq;
        ::QueryPerformanceFrequency( &freq );
        ::QueryPerformanceCounter( &start );
        int res = fib(n);
        ::QueryPerformanceCounter( &end );
        delta.QuadPart = end.QuadPart - start.QuadPart;
        cout << res << endl;
        cout << ( delta.QuadPart * 1000 ) / freq.QuadPart <<endl;
break;
    }

    return 0;
}

C#版本:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;

using System.Runtime.InteropServices;
using System.ComponentModel;
using System.Threading;
using System.IO;

using System.Diagnostics;

namespace fibCSTest
{
    class Program
    {
         static int fib(int n)
         {
            if (n < 2)return n;
            return fib(n - 1) + fib(n - 2);
         }

         static void Main(string[] args)
         {
             //var sw = new Stopwatch();
             //var timer = new PAB.HiPerfTimer();
             var timer = new Stopwatch();
             while (true)
             {
                 int n;
                 //cin >> n;
                 n = 41;
                 if (n < 0) break;
                 timer.Start();
                 int res = fib(n);
                 timer.Stop();
                 Console.WriteLine(res);
                 Console.WriteLine(timer.ElapsedMilliseconds);
                 break;
             }
         }
    }
}

GCC 版本:

#include <iostream>
#include <stdio.h>
#include <sys/time.h>
using namespace std;

int fib(int n)
{
    if (n < 2) return n;
    return fib(n - 1) + fib(n - 2);
}

int main()
{
    timeval start, end;
    while (1)
    {
        int n;
        //cin >> n;
        n = 41;
        if (n < 0) break;
        gettimeofday(&start, 0);
        int res = fib(n);
        gettimeofday(&end, 0);
        int sec = end.tv_sec - start.tv_sec;
        int usec = end.tv_usec - start.tv_usec;
        cout << res << endl;
        cout << sec << " " << usec <<endl;
        break;
    }

    return 0;
}

最佳答案

编辑:TL/DR 版本:CLR JIT 将内联一级递归，MSVC 8 SP1 不会没有 #pragma inline_recursion(on)。您应该在调试器之外运行 C# 版本以获得完全优化的 JIT。

在运行 Vista 并插入“高性能”电源设置(~1600 ms 对 ~3800 ms)的 Core2 Duo 笔记本电脑上使用 VS 2008 SP1 使用 C# 与 C++ 时，我得到了与 acidzombie24 相似的结果。查看优化的 JIT'd C# 代码有点棘手，但对于 x86，它归结为:

00000000 55               push        ebp  
00000001 8B EC            mov         ebp,esp 
00000003 57               push        edi  
00000004 56               push        esi  
00000005 53               push        ebx  
00000006 8B F1            mov         esi,ecx 
00000008 83 FE 02         cmp         esi,2 
0000000b 7D 07            jge         00000014 
0000000d 8B C6            mov         eax,esi 
0000000f 5B               pop         ebx  
00000010 5E               pop         esi  
00000011 5F               pop         edi  
00000012 5D               pop         ebp  
00000013 C3               ret              
            return fib(n - 1) + fib(n - 2);
00000014 8D 7E FF         lea         edi,[esi-1] 
00000017 83 FF 02         cmp         edi,2 
0000001a 7D 04            jge         00000020 
0000001c 8B DF            mov         ebx,edi 
0000001e EB 19            jmp         00000039 
00000020 8D 4F FF         lea         ecx,[edi-1] 
00000023 FF 15 F8 2F 12 00 call        dword ptr ds:[00122FF8h] 
00000029 8B D8            mov         ebx,eax 
0000002b 4F               dec         edi  
0000002c 4F               dec         edi  
0000002d 8B CF            mov         ecx,edi 
0000002f FF 15 F8 2F 12 00 call        dword ptr ds:[00122FF8h] 
00000035 03 C3            add         eax,ebx 
00000037 8B D8            mov         ebx,eax 
00000039 4E               dec         esi  
0000003a 4E               dec         esi  
0000003b 83 FE 02         cmp         esi,2 
0000003e 7D 04            jge         00000044 
00000040 8B D6            mov         edx,esi 
00000042 EB 19            jmp         0000005D 
00000044 8D 4E FF         lea         ecx,[esi-1] 
00000047 FF 15 F8 2F 12 00 call        dword ptr ds:[00122FF8h] 
0000004d 8B F8            mov         edi,eax 
0000004f 4E               dec         esi  
00000050 4E               dec         esi  
00000051 8B CE            mov         ecx,esi 
00000053 FF 15 F8 2F 12 00 call        dword ptr ds:[00122FF8h] 
00000059 03 C7            add         eax,edi 
0000005b 8B D0            mov         edx,eax 
0000005d 03 DA            add         ebx,edx 
0000005f 8B C3            mov         eax,ebx 
00000061 5B               pop         ebx  
00000062 5E               pop         esi  
00000063 5F               pop         edi  
00000064 5D               pop         ebp  
00000065 C3               ret

对比C++生成的代码(/Ox/Ob2/Oi/Ot/Oy/GL/Gr):

int fib(int n)
{ 
00B31000 56               push        esi  
00B31001 8B F1            mov         esi,ecx 
    if (n < 2) return n; 
00B31003 83 FE 02         cmp         esi,2 
00B31006 7D 04            jge         fib+0Ch (0B3100Ch) 
00B31008 8B C6            mov         eax,esi 
00B3100A 5E               pop         esi  
00B3100B C3               ret              
00B3100C 57               push        edi  
    return fib(n - 1) + fib(n - 2); 
00B3100D 8D 4E FE         lea         ecx,[esi-2] 
00B31010 E8 EB FF FF FF   call        fib (0B31000h) 
00B31015 8D 4E FF         lea         ecx,[esi-1] 
00B31018 8B F8            mov         edi,eax 
00B3101A E8 E1 FF FF FF   call        fib (0B31000h) 
00B3101F 03 C7            add         eax,edi 
00B31021 5F               pop         edi  
00B31022 5E               pop         esi  
} 
00B31023 C3               ret

C# 版本基本上内联了 fib(n-1) 和 fib(n-2)。对于 call 如此繁重的函数，减少函数调用的次数是提高速度的关键。将 fib 替换为以下内容:

int fib(int n);

int fib2(int n) 
{ 
    if (n < 2) return n; 
    return fib(n - 1) + fib(n - 2); 
} 

int fib(int n)
{ 
    if (n < 2) return n; 
    return fib2(n - 1) + fib2(n - 2); 
}

将其降低到 ~1900 毫秒。顺便说一句，如果我使用 #pragma inline_recursion(on)，我会得到与原始 fib 相似的结果。再展开一层:

int fib(int n);

int fib3(int n) 
{ 
    if (n < 2) return n; 
    return fib(n - 1) + fib(n - 2); 
} 

int fib2(int n) 
{ 
    if (n < 2) return n; 
    return fib3(n - 1) + fib3(n - 2); 
} 

int fib(int n)
{ 
    if (n < 2) return n; 
    return fib2(n - 1) + fib2(n - 2); 
}

将其降低到 ~1380 毫秒。除此之外，它会逐渐减少。

因此，我的机器的 CLR JIT 似乎会将递归调用内联一级，而 C++ 编译器默认不会这样做。

如果所有性能关键代码都像 fib!

关于c# - 在这种情况下，为什么 .NET 比 C++ 快？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2285864/

c# - 在这种情况下，为什么 .NET 比 C++ 快？

上一篇：c++ - attribute((packed)) 会影响程序的性能吗？

下一篇：c++ - 将 FFT 转换为频谱图

c# - 在这种情况下，为什么 .NET 比 C++ 快？

上一篇：c++ - __attribute__((packed)) 会影响程序的性能吗？

下一篇：c++ - 将 FFT 转换为频谱图

上一篇：c++ - attribute((packed)) 会影响程序的性能吗？