python - 素数与 python

<分区>

我对编程还很陌生，所以我决定做一些练习来提高我的能力。我被一个练习卡住了:“找出两百万以下所有素数的总和。”我的代码太慢了。

最初，我尝试将其作为一个普通的素数问题来解决，结果是这样的:

sum = 2 + 3
for i in range (5, 2000000, 2):
    for j in range (3, i, 2):
        if i%j == 0:
            break
    else:
        sum += i
print(sum)

这样，所有的偶数都会被排除在循环之外。但这并没有解决我的问题。这里的量级真的很大。

所以我试图了解这段代码发生了什么。我在循环内有一个循环，循环内的循环运行外部循环时间的索引(不完全是因为列表不是从 0 开始的)，对吧？因此，当我试图找到 20 以下的素数时，它运行外部循环 8 次，但内部循环运行 60 次(我不知道这个数学是否正确，正如我所说，我对编程非常了解)。但是当我将它与 2,000,000 一起使用时，我总共运行了大约 999,993,000,012 次内部循环，这太疯狂了。

我的 friend 告诉我埃拉托色尼筛法，我尝试创建一个新代码:

list = [2]
list.extend(range(3, 2000000, 2))
for i in list:
    for j in list:
        if j%i == 0 and j > i:
            list.remove(j)
print(sum(list))

这就是我在尝试模拟筛子时取得的成果(忽略偶数有帮助)。它要快得多(使用其他代码，找到 200,000 以下的素数需要很长时间，而使用这个新代码我可以做到)但是在合理的时间内计算 2,000,000,000 是不够的。自从我开始编写代码以来，代码就在后台运行，但仍然没有。我不知道这个东西循环了多少次，我现在想都累得想不起来。

我是来求助的。为什么这么慢？我应该学习/阅读/做什么来改进我的代码？还有比这个筛子更有效的方法吗？感谢您的宝贵时间。

最佳答案

因为 list.remove 是一个 O(n) 操作，而且您经常这样做。而且您不是在进行真正的筛选，只是变相的试验；您仍在执行您在原始代码中执行的所有剩余测试。

Eratosthenes 筛法通常使用一组标志来实现；在最简单的形式中，每个索引对应于相同的数字，并且对于除 0 和 1 之外的所有索引，该值最初都是 True。您进行迭代，当您找到一个 True 值时，您将所有为其倍数的索引设置为 False。这意味着工作是顺序加法，而不是乘法，而不是除法(这要昂贵得多。

关于python - 素数与 python，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34937181/

上一篇：python pandas系列获取一行的索引号

下一篇：python - 如何减去两个无符号的 numpy 数组以给出带符号的结果？

相关文章：

python - Python 内部是如何存储日期时间的？

python - 无法在 GAE 中添加来自其他域的电子邮件地址

c# - 如何避免 403 Forbidden 响应的 WebException？

java - 如何从扫描仪获取多个整数输入并将每个整数存储在单独的数组中？

java:字符串索引超出范围:6

python - pandas 通过非 nan 值之前和之后填充 nans

python - 如何使用 REST api 运行 zeppelin 笔记本并在 python 中返回结果？

php - 用户语言设置 - 获取设置和显示它的最有效方式

javascript - 如何提高字典的性能？

Python:如何仅提取x个字符的字符 block 中的完整单词？