以下代码使用欧几里得算法计算 gcd(a,b) 和整数 s, t 使得 sa+tb=gcd(a,b)(对于离散数学类(class))。我用 C 编写了它,也许这会清楚地说明算法。
gcd.c:
#include <stdio.h>
int gcd_st(int m, int n, int *s, int *t) {
int a, b, res, tmp;
a = m>n?m:n;
b = m>n?n:m;
if(!b) {
*s = 1;
*t = 0;
return a;
}
res = gcd_st(b, a%b, s, t);
tmp = *t;
*t = *s - *t*(a/b);
*s = tmp;
return res;
}
int main() {
int st[2];
for(int i=0; i<100000000; i++)
gcd_st(42, 56, st, st+1);
for(int i=0; i<100000000; i++)
gcd_st(273, 110, st, st+1);
int res = gcd_st(42, 56, st, st+1);
printf("%d %d %d\n", res, st[0], st[1]);
res = gcd_st(273, 110, st, st+1);
printf("%d %d %d\n", res, st[0], st[1]);
}
为了好玩,我决定也用 Scheme (Lisp) 编写代码。起初,我在MIT Scheme的实现上测试了它,然后使用Racket的实现。
gcd.scm(没有前两行); gcd.rkt(包括前两行):
#!/usr/bin/racket
#lang racket/base
(define (gcd_st m n)
(let ((a (max m n)) (b (min m n)))
(if (= b 0) (list a 1 0)
(let ((res (gcd_st b (remainder a b))))
(let ((val (list-ref res 0))
(s (list-ref res 1))
(t (list-ref res 2)))
(list val t (- s (* t (quotient a b)))))))))
(define (loop n fn)
(if (= n 0) 0
(loop (- n 1) fn)))
(loop 100000000 (lambda () (gcd_st 42 56)))
(loop 100000000 (lambda () (gcd_st 273 110)))
(display "a b: (gcd s t)\n42 56: ")
(display (gcd_st 42 56))
(display "\n273 110: ")
(display (gcd_st 273 110))
(display "\n")
两个程序在两个样本案例上运行 10^8 次迭代并产生相同的输出。然而,这两个 Scheme 实现(共享相同的代码/算法)在性能上有很大差异。 Racket 实现也比 C 实现快得多,而 C 实现又比 MIT-Scheme 实现快得多。
时间差异如此之大,我想也许 Racket 正在优化整个循环,因为结果从未被使用过,但时间似乎仍然与循环迭代呈线性关系。是否有可能它正在做一些自省(introspection)并优化循环中的一些代码?
$ time ./gcd.rkt # Racket
0
0
a b: (gcd s t)
42 56: (14 1 -1)
273 110: (1 27 -67)
real 0m0.590s
user 0m0.565s
sys 0m0.023s
$ time scheme --quiet <gcd.scm # MIT-Scheme
a b: (gcd s t)
42 56: (14 1 -1)
273 110: (1 27 -67)
real 0m59.250s
user 0m58.886s
sys 0m0.129s
$ time ./gcd.out # C
14 1 -1
1 27 -67
real 0m7.987s
user 0m7.967s
sys 0m0.000s
为什么 Racket 的实现速度如此之快?
=====
更新:如果有人想知道,这里是使用更正循环函数并考虑到答案的结果:
循环
:
(define (loop n fn)
(fn)
(if (= n 1) 0
(loop (- n 1) fn)))
Racket (仍然稍微优于 C,甚至包括它的设置时间):
real 0m7.544s
user 0m7.472s
sys 0m0.050s
麻省理工学院计划
real 9m59.392s
user 9m57.568s
sys 0m0.113s
但是,关于 Scheme 实现之间的巨大差异(仍然很大)的问题仍然存在。我将单独询问此问题以忽略与先前错误的混淆。
最佳答案
您实际上并没有调用在您的 loop
实现中调用计算的 thunk。这就是为什么它比 C 实现快得多的原因。您实际上并没有计算任何东西。
我不确定为什么 MIT Scheme 对此如此缓慢。从 1 亿开始倒数似乎应该像在 Racket 中一样快如闪电。
要真正冗余地计算 gcd,丢弃结果,并测量时间,像这样实现循环:
(define (loop n fn)
(if (= n 0) 0
(begin
(fn)
(loop (- n 1) fn))))
关于performance - 为什么 Racket 的实现比 MIT Scheme 快这么多?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60022612/