c++ - 这个素数测试如何使代码快 5000 倍?

标签 c++ stl set primes gmp

警告:此代码是 Project Euler 的解决方案 Problem 50 .如果不想被剧透,请不要看这里。

我有一段代码可以搜索一长串连续的素数,这些素数加在一起也是素数。有一次,我需要测试一个和是否为质数。

我有两个测试,在函数 computeMaxPrime 中进行了 ifdef。第一个根据 std::素数集检查总和。第二种使用 GMP 实现的 Miller-Rabin 测试。该函数仅被调用 6 次。当我使用第一个测试时,函数 computeMaxPrime 需要 0.12 秒。当我使用第二个测试时,只需要 ~.00002 秒。有人可以解释这怎么可能吗?我不认为 6 个调用来检查一个数字是否在一个集合中会花费 100 毫秒。我也试过使用 unordered_set,它的表现是一样的。

我认为这可能是一个计时问题,但我已经通过从终端(在 OSX 上)计时整个程序的执行来验证它。我还验证了如果我将测试更改为首先使用 Miller-Rabin 测试,然后确认使用该集合,它会对该集合进行一次调用并且时钟报告 0.02 秒,这正是我所期望的 (1/6th 只使用集合测试的总时间)。

#include "PrimeGenerator2.h"
#include <set>
#include <stdio.h>
#include <time.h>
#include <gmp.h>

typedef std::set<u_int64t>       intSet;

bool isInIntSet (intSet       set,
                 u_int64t     key)
{
  return (set.count(key) > 0);
}

bool isPrime (u_int64t key)
{
  mpz_t      integ;

  mpz_init (integ);
  mpz_set_ui (integ, key);
  return (mpz_probab_prime_p (integ, 25) > 0);
}

void computeInitialData (const u_int64t   limit,
                         intSet      *primeSet,
                         intList     *sumList,
                         u_int64t    *maxCountUpperBound)
{
  PrimeSieve     sieve;
  u_int64t     cumSum = 0;
  u_int64t     pastUpperBound = 0;

  *maxCountUpperBound = 0;

  for (u_int64t prime = sieve.NextPrime(); prime < limit; prime = sieve.NextPrime()) {
    primeSet->insert(prime);

    cumSum += prime;
    sumList->push_back(cumSum);
    if (cumSum < limit)
      (*maxCountUpperBound)++;
    else
      pastUpperBound++;
  }
}

u_int64t computeMaxPrime (const u_int64t   limit,
                          const intSet  &primeSet,
                          const intList &sumList,
                          const u_int64t   maxCountUpperBound)
{
  for (int maxCount = maxCountUpperBound; ; maxCount--) {
    for (int i = 0; i + maxCount < sumList.size(); i++) {
      u_int64t   sum;

      sum = sumList[maxCount + i] - sumList[i];
      if (sum > limit)
        break;
#if 0
      if (isInIntSet (primeSet, sum))
        return sum;
#else
      if (isPrime (sum))
        return sum;
#endif
    }
  }

  return 0; // This should never happen
}

u_int64t findMaxCount (const u_int64t   limit)
{ 
  intSet       primeSet;  // Contains the set of all primes < limit
  intList      sumList; // Array of cumulative sums of primes

  u_int64t     maxCountUpperBound = 0;  // Used an initial guess for the maximum count
  u_int64t     maxPrime;          // Final return value

  clock_t      time0, time1, time2;

  time0     = clock();
  computeInitialData (limit, &primeSet, &sumList, &maxCountUpperBound);
  time1     = clock();
  maxPrime  = computeMaxPrime (limit, primeSet, sumList, maxCountUpperBound);
  time2     = clock();  

  printf ("%f seconds for primes \n"  , (double)(time1 - time0)/CLOCKS_PER_SEC);
  printf ("%f seconds for search \n"  , (double)(time2 - time1)/CLOCKS_PER_SEC);  

  return maxPrime;
}

int main(void)
{
  printf ("%lld\n", findMaxCount(1000000));
}

编辑:哦,这更奇怪。似乎与 STL 集无关。如果我做一个 hack 来制作 isInIntSet 只是检查它被调用了多少次,与 GMP 测试相比它同样慢。这让我觉得我可能刚刚遇到了一个编译器错误(EDIT2:永远不要责怪编译器!)

bool isInIntSet (intSet set, u_int64t key)
{
  static int  counter = 0;
  counter++;
  return (counter == 6);
}

最佳答案

呃。函数 isInIntSet 直接将 intSet 作为参数,因此整个集合都被复制了。我的意思是通过引用传递 (intSet &set)。使用 unordered_set 时,搜索时间减少到 .000003 秒。

关于c++ - 这个素数测试如何使代码快 5000 倍?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18651623/

相关文章:

c++ - 如何循环 std::regex_search 的结果?

c++ - 如果我想让它忽略重复的元素,应该使用哪个 STL 容器?

java - 在 Set 集合中搜索

java - Java HashSet分区中如何选择唯一代表

c++ - 使用结构 vector 解决边界错误

c++ - 直接访问结构内结构的属性?

c++ - ZXing 库 : Errors in iOS: private field 'cached_y_' is not used

c++ - 为一对中的一个元素提供小于运算符

java - 设计一个 "updatable"静态集与 Spring 一起使用?

c++ - Qt QSerialport拔出设备未关闭