python - 在 Python 中实现霍纳方法的问题

所以我写下了使用三种不同方法评估多项式的代码。霍纳的方法应该是最快的，而天真的方法应该是最慢的，对吧？但是为什么计算它的时间不是我所期望的呢？对于迭代和朴素方法，计算时间有时会完全相同。它有什么问题？

import numpy.random as npr
import time

def Horner(c,x):
    p=0
    for i in c[-1::-1]:
        p = p*x+i
    return p

def naive(c,x):
    n = len(c)
    p = 0
    for i in range(len(c)):
        p += c[i]*x**i 
    return p

def itera(c,x):
    p = 0
    xi = 1
    for i in range(len(c)):
        p += c[i]*xi
        xi *= x 
    return p

c=npr.uniform(size=(500,1))
x=-1.34

start_time=time.time()
print Horner(c,x)
print time.time()-start_time

start_time=time.time()
print itera(c,x)
print time.time()-start_time

start_time=time.time()
print naive(c,x)
print time.time()-start_time

以下是一些结果:

[  2.58646959e+69]
0.00699996948242
[  2.58646959e+69]
0.00600004196167
[  2.58646959e+69]
0.00600004196167

[ -3.30717922e+69]
0.00899982452393
[ -3.30717922e+69]
0.00600004196167
[ -3.30717922e+69]
0.00600004196167

[ -2.83469309e+69]
0.00999999046326
[ -2.83469309e+69]
0.00999999046326
[ -2.83469309e+69]
0.0120000839233

最佳答案

您的分析可以大大改善。此外，我们可以让您的代码运行速度提高 200-500 倍。

(1) 冲洗并重复

您不能只运行一次性能测试迭代，原因有二。

您的时间分辨率可能不够好。这就是为什么您有时会在两种实现中获得相同的时间:一次运行的时间接近您的计时机制的分辨率，因此您只记录了一个“滴答声”。
影响性能的因素有各种。进行有意义的比较的最佳选择是多次迭代。

您不需要无数次运行(当然，这并没有什么坏处)，但是您可以估计并调整迭代次数，直到方差在您的目的可接受的范围内。

timeit 是一个不错的小模块，用于分析 Python 代码。

我将此添加到您的脚本底部。

import timeit

n = 1000

print 'Horner', timeit.timeit(
    number = n,
    setup='from __main__ import Horner, c, x',
    stmt='Horner(c,x)'
)
print 'naive', timeit.timeit(
    number = n,
    setup='from __main__ import naive, c, x',
    stmt='naive(c,x)', 
)
print 'itera', timeit.timeit(
    number = n,
    setup='from __main__ import itera, c, x',
    stmt='itera(c,x)', 
)

哪个产生

Horner 1.8656351566314697
naive 2.2408010959625244
itera 1.9751169681549072

Horner 是最快的，但它并没有完全击败其他两个。

(2) 看看发生了什么……非常仔细

Python 有运算符重载，所以很容易错过。

npr.uniform(size=(500,1)) 为您提供 500 x 1 numpy 随机数结构。

那又怎样？

嗯，c[i] 不是数字。 这是一个带有一个元素的 numpy 数组。 Numpy 重载了运算符，因此您可以执行诸如将数组乘以标量之类的操作。

这很好，但是为每个元素使用一个数组很多开销，因此很难看出算法之间的差异。

相反，让我们尝试一个简单的 Python 列表:

import random
c = [random.random() for _ in range(500)]

现在，

Horner 0.034661054611206055
naive 0.12771987915039062
itera 0.07331395149230957

哇! 所有时间都变快了(快了 10-60 倍)。按比例，Horner 实现比其他两个更快。我们移除了所有三个的开销，现在可以看到“基本”的差异。

Horner 比 naive 快 4 倍，比 itera 快 2 倍。

(3) 备用运行时

您使用的是 Python 2。我假设是 2.7。

让我们看看 Python 3.4 的表现如何。 (语法调整:您需要在参数列表周围加上括号以 print。)

Horner 0.03298933599944576
naive 0.13706714100044337
itera 0.06771054599812487

差不多。

让我们试试PyPy , Python 的 JIT 实现。 (“正常”的 Python 实现称为 CPython。)

Horner 0.006507158279418945
naive 0.07541298866271973
itera 0.005059003829956055

不错!现在，每个实现的运行速度都快了 2-5 倍。 Horner 现在的速度是 naive 的 10 倍，但比 itera 稍慢。

JIT 运行时比解释器更难分析。让我们将迭代次数增加到 50000 次，并尝试一下以确保。

Horner 0.12749004364013672
naive 3.2823100090026855
itera 0.06546688079833984

(请注意，我们有 50 倍的迭代，但只有 20 倍的时间……在前 1000 次运行中，JIT 并没有完全发挥作用。)同样的结论，但差异更加明显。

诚然，JIT 的想法是在运行时对程序进行剖析、分析和重写，因此如果您的目标是比较算法，这将添加很多不明显的实现细节。

不过，比较运行时有助于提供更广阔的视野。

还有一些事情。例如，您的幼稚实现会计算一个它从不使用的变量。您使用 range 而不是 xrange。您可以尝试使用索引而不是反向切片向后迭代。等等。

这些对我来说都没有太大的改变，但它们值得考虑。

关于python - 在 Python 中实现霍纳方法的问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28250401/

python - 在 Python 中实现霍纳方法的问题

上一篇：python - 如何更改 pandas MultiIndex 列的顺序/分组/级别？

下一篇：python - 如何在 PyCharm 中找到一个类的所有未使用的方法？