c++ - C 和 C++ 奇怪的性能差异

标签 c++ c performance benchmarking

在您阅读我的帖子之前,请考虑到我是 C 和 C++ 的新手。 我主要是一名托管代码开发人员。

我有两段相同的代码(至少我是这么认为的)。 一种在 C 中,一种在 C++ 中。 该代码主要检查数字是否为素数,如果是,它将把它存储在一个容器中。

C++

main.cpp

#include <iostream>
#include <vector>
#include <time.h>

static bool isPrime(const int& number) {

    if((number & 1) == 0) {
        if(number == 2)
            return true;
        else
            return false;
    }

    for(int i = 3; (i * i) <= number; i++) {

        if((number % i) == 0)
            return false;
    }

    return number != 1;
}

int main(int argc, const char * argv[]) {

    std::vector<int> vector;
    clock_t start = clock();
    for(int i = 0; i < 30000000; i++) {

        if(isPrime(i))
            vector.push_back(i);
    }
    clock_t end = clock();
    clock_t seconds = (end - start) / CLOCKS_PER_SEC;
    std::cout << "done after " << seconds << " seconds " << std::endl;

    return 0;
}

C

vector .c

#include <stdlib.h>


typedef struct vector_class {
    void(*push_back)(struct vector_class *vector_instance, const int *data);
    int *data;
    int length;
    int capacity;
} vector;

static void push_back(vector *vector_instance, const int *data) {

    if(vector_instance->length >= vector_instance->capacity) {

        vector_instance->capacity *= 2;
        vector_instance->data = (int*) realloc(vector_instance->data, sizeof(int) * vector_instance->capacity);
    }
    vector_instance->data[vector_instance->length] = *data;
    vector_instance->length++;
}

static void vector_constructor(vector *vector_instance) {

    vector_instance->push_back = &push_back;
    vector_instance->length = 0;
    vector_instance->capacity = 2;
    vector_instance->data = (int*)malloc(sizeof(*vector_instance->data) * vector_instance->capacity);

}

static void vector_destructor(vector *vector_instance) {

    free(vector_instance->data);
    vector_instance->length = 0;
    vector_instance->capacity = 0;
    vector_instance->data = NULL;
}

主要.c

#include <stdio.h>
#include "vector.c"
#include <time.h>

static int isPrime (const int *number) {

    if((*number & 1) == 0) {
        if(*number == 2)
            return 1;
        else
            return 0;
    }

    for(int i = 3; (i * i) <= *number; i += 2) {

        if((*number % i) == 0)
            return 0;
    }

    return *number != 1;
}

int main(int argc, const char * argv[]) {
    vector v;
    vector_constructor(&v);
    clock_t start = clock();
    for(int i = 0; i <= 30000000; i++) {

        if(isPrime(&i))
            v.push_back(&v, &i);
    }
    clock_t end = clock();
    clock_t seconds = (end - start) / CLOCKS_PER_SEC;
    printf("%lu seconds \n", seconds);

    for(int i = 0; i < v.length; i++) {

        //printf("%d \n", v.data[i]);
    }
    vector_destructor(&v);
    return 0;
}

我使用内置的 Clang 编译器在我的 OS X Mavericks 上编译这两个程序。

C++

g++ -O3 -std=c++11 Main.cpp

C

gcc -O3 -std=c99 Main.c

两者都能顺利编译,也能顺利运行。 然而..

我得到不同的时间结果。

C 在12 秒

后完成

C++ 在 26 秒后完成

谁能指出我做错了什么? 谢谢!

最佳答案

您的程序在 isPrime 中略有不同。在你的 C++ 程序中:

for(int i = 3; (i * i) <= number; i++) {

在你的 C 程序中:

for(int i = 3; (i * i) <= *number; i += 2) {

因此,您的 C++ 程序计算余数的次数大约是 C 程序的两倍,这可能解释了您的性能差异。

除此之外,除非有充分的理由,否则我建议您不要通过引用或指针传递 int。希望编译器足够聪明,可以发现您不需要并优化它,但谁知道呢?

此外,您还希望尽可能避免像在 C 程序中那样通过函数指针调用函数。它们通常会损害编译器内联优化函数的能力。这里的情况可能是编译器足够聪明,无论如何都可以内联调用,但谁又知道呢?

最后,如果计算所有小于 N 的素数确实是您所追求的,并且这不是用来对 C 与 C++ 进行基准测试的玩具,那么请查看 Sieve of EratosthenesSieve of Sundaram .或者,您可以将已知素数的 vector 传递到 isPrime 并仅检查已知素数而不是所有奇数。

关于c++ - C 和 C++ 奇怪的性能差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29078077/

相关文章:

多次调用的C++随机数生成器

c - 指向字符串的指针数组

c# - 为什么将 OrderBy 添加到 LINQ to EF 查询可以提高其性能?

sqlite - 加快SQLite中的SQL选择

c++ - Matlab 2013a + MEX C 程序

c++ - 如何覆盖 [] 使我的类看起来就像一个 3 维矩阵

c++ - 如何在 C++ 中生成 UUID,而不使用 boost 库?

c++ - c++中如何将字符串转换为string中提到的数据类型

c - C 中参数的数量可变?

MySQL。拥有一个 1M 记录的表或 10 个表,每个表 100K 记录更好(性能)吗?