python - 增加列表理解中多个 for 循环的时间

标签 python multithreading performance time-complexity list-comprehension

我正在寻找一种方法来降低 Python 3.5 在列表推导式中执行两个 for 循环所需的执行时间,如下所示:

[[(k1-k2)**power for k2 in range(m,n)] for k1 in range(m,n)]

最佳答案

所以,我从您当前的方法开始,发现虽然它确实有效,但速度很慢。我的第一次尝试涉及简单地将您的列表理解转换为使用 numpy 数组的合适方法。这比你原来的方法快了大约三倍,但那时我注意到了一些非常漂亮的东西:这是一个对称的 Toeplitz matrix 。来自该维基页面:

In linear algebra, a Toeplitz matrix or diagonal-constant matrix, named after Otto Toeplitz, is a matrix in which each descending diagonal from left to right is constant.

我首先使用了 Toeplitz 矩阵的默认 scipy 实现,但这种方法对于您的问题来说是不必要的缓慢。所以我自己写了一个类似的方法,这是下面的第三次尝试。

方法论

我为每种方法运行了 10 次测试,每个单独的测试包含 1000 次运行。我将参数设置为 m = 10, n = 100。结果见下表:

    Your approach       Numpy #1     Numpy #2     Numpy #3
1        4.573965       1.432406     1.060242     0.186767
2        4.341466       1.432237     1.060404     0.186872
3        4.442438       1.434460     1.144850     0.183120
4        4.318919       1.456928     1.072072     0.185626
5        4.249392       1.450684     1.072217     0.183273
6        4.202730       1.508863     1.070299     0.183019
7        4.224226       1.457543     1.065354     0.183591
8        4.234505       1.432971     1.082438     0.185711
9        4.256538       1.431828     1.080051     0.184290
10       4.241055       1.557204     1.083070     0.185845

AVG      4.308523       1.459512     1.079100     0.184811
STD      0.117433       0.041693     0.024538     0.001521

scipy Toeplitz 方法(表中的Numpy #2)几乎比您当前的方法快四倍,但所有这些结果都与第三个也是最后一个相形见绌方法:比最初的实现速度提高了 23 倍!

现在,由于您对时间复杂度感兴趣,我让 n 变化,保持 m = 10。每种方法的结果如下图所示:

Time complexity of the different approaches.

显然,第三种方法是可行的方法!

代码

完整代码:

import timeit
import numpy as np
from scipy.linalg import toeplitz


def your_approach(m, n):
    print("\n\tlist comprehension")
    k = range(m, n)
    for i in range(1, 11):
        start = timeit.default_timer()
        for j in range(1, 1001):
            data_list_comp = [[(k1 - k2) ** 2 for k2 in k] for k1 in k]
        print("\t{}".format(timeit.default_timer() - start))
    return data_list_comp


def numpy1(m, n):
    print("\n\tnumpy")
    k_n = np.array(range(m, n))
    for i in range(1, 11):
        start = timeit.default_timer()
        for j in range(1, 1001):
            data_numpy = [list((k_n - x) ** 2) for x in k_n]
        print("\t{}".format(timeit.default_timer() - start))
    return data_numpy


def numpy2(m, n):
    print("\n\ttoeplitz")
    k_n = np.array(range(0, n - m)) ** 2
    toep = toeplitz(k_n)
    for i in range(1, 11):
        start = timeit.default_timer()
        for j in range(1, 1001):
            data_numpy = [list(toep[:, i]) for i in range(n - m)]
        print("\t{}".format(timeit.default_timer() - start))
    return data_numpy

def numpy3(m, n):
    print("\n\ttoeplitz2")
    k_n = list(np.array(range(0, n - m)) ** 2)  # can obviously be done without numpy, but I was a bit lazy. :)
    for i in range(1, 11):
        start = timeit.default_timer()
        for j in range(1, 1001):
            data_numpy = [(k_n[i::-1] + k_n[1:-i]) if i != 0 else k_n for i in range(0, n - m)]
        print("\t{}".format(timeit.default_timer() - start))
    return data_numpy

m = 10

for n in [25, 50, 100, 150, 200]:
    assert your_approach(m, n) == numpy1(m, n) == numpy2(m, n) == numpy3(m, n)

关于python - 增加列表理解中多个 for 循环的时间,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34658923/

相关文章:

performance - TLB 未命中与缓存未命中?

performance - 是否建议使用 Redis 或 Memcached 作为 FILES 的缓存?

Python dict get 函数没有做正确的事情?

python - 生成距中心远大于 50 个单位但小于 250 个单位的随机坐标

python - Windows - 执行不带 .exe 扩展名的可执行文件 (.exe)

java - 并发HashMap : remove on condition

Python 打印对象地址而不是值

c - c问题中的多线程

multithreading - MPI和pthreads : nodes with different numbers of cores

Java 正则表达式运行速度很慢