在您阅读我的帖子之前,请考虑到我是 C 和 C++ 的新手。 我主要是一名托管代码开发人员。
我有两段相同的代码(至少我是这么认为的)。 一种在 C 中,一种在 C++ 中。 该代码主要检查数字是否为素数,如果是,它将把它存储在一个容器中。
C++
main.cpp
#include <iostream>
#include <vector>
#include <time.h>
static bool isPrime(const int& number) {
if((number & 1) == 0) {
if(number == 2)
return true;
else
return false;
}
for(int i = 3; (i * i) <= number; i++) {
if((number % i) == 0)
return false;
}
return number != 1;
}
int main(int argc, const char * argv[]) {
std::vector<int> vector;
clock_t start = clock();
for(int i = 0; i < 30000000; i++) {
if(isPrime(i))
vector.push_back(i);
}
clock_t end = clock();
clock_t seconds = (end - start) / CLOCKS_PER_SEC;
std::cout << "done after " << seconds << " seconds " << std::endl;
return 0;
}
C
vector .c
#include <stdlib.h>
typedef struct vector_class {
void(*push_back)(struct vector_class *vector_instance, const int *data);
int *data;
int length;
int capacity;
} vector;
static void push_back(vector *vector_instance, const int *data) {
if(vector_instance->length >= vector_instance->capacity) {
vector_instance->capacity *= 2;
vector_instance->data = (int*) realloc(vector_instance->data, sizeof(int) * vector_instance->capacity);
}
vector_instance->data[vector_instance->length] = *data;
vector_instance->length++;
}
static void vector_constructor(vector *vector_instance) {
vector_instance->push_back = &push_back;
vector_instance->length = 0;
vector_instance->capacity = 2;
vector_instance->data = (int*)malloc(sizeof(*vector_instance->data) * vector_instance->capacity);
}
static void vector_destructor(vector *vector_instance) {
free(vector_instance->data);
vector_instance->length = 0;
vector_instance->capacity = 0;
vector_instance->data = NULL;
}
主要.c
#include <stdio.h>
#include "vector.c"
#include <time.h>
static int isPrime (const int *number) {
if((*number & 1) == 0) {
if(*number == 2)
return 1;
else
return 0;
}
for(int i = 3; (i * i) <= *number; i += 2) {
if((*number % i) == 0)
return 0;
}
return *number != 1;
}
int main(int argc, const char * argv[]) {
vector v;
vector_constructor(&v);
clock_t start = clock();
for(int i = 0; i <= 30000000; i++) {
if(isPrime(&i))
v.push_back(&v, &i);
}
clock_t end = clock();
clock_t seconds = (end - start) / CLOCKS_PER_SEC;
printf("%lu seconds \n", seconds);
for(int i = 0; i < v.length; i++) {
//printf("%d \n", v.data[i]);
}
vector_destructor(&v);
return 0;
}
我使用内置的 Clang 编译器在我的 OS X Mavericks 上编译这两个程序。
C++
g++ -O3 -std=c++11 Main.cpp
C
gcc -O3 -std=c99 Main.c
两者都能顺利编译,也能顺利运行。 然而..
我得到不同的时间结果。
C 在12 秒
后完成C++ 在 26 秒后完成
谁能指出我做错了什么? 谢谢!
最佳答案
您的程序在 isPrime
中略有不同。在你的 C++ 程序中:
for(int i = 3; (i * i) <= number; i++) {
在你的 C 程序中:
for(int i = 3; (i * i) <= *number; i += 2) {
因此,您的 C++ 程序计算余数的次数大约是 C 程序的两倍,这可能解释了您的性能差异。
除此之外,除非有充分的理由,否则我建议您不要通过引用或指针传递 int
。希望编译器足够聪明,可以发现您不需要并优化它,但谁知道呢?
此外,您还希望尽可能避免像在 C 程序中那样通过函数指针调用函数。它们通常会损害编译器内联优化函数的能力。这里的情况可能是编译器足够聪明,无论如何都可以内联调用,但谁又知道呢?
最后,如果计算所有小于 N 的素数确实是您所追求的,并且这不是用来对 C 与 C++ 进行基准测试的玩具,那么请查看 Sieve of Eratosthenes或 Sieve of Sundaram .或者,您可以将已知素数的 vector 传递到 isPrime
并仅检查已知素数而不是所有奇数。
关于c++ - C 和 C++ 奇怪的性能差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29078077/