python - 多处理。池 : What's the difference between map_async and imap?

我正在尝试学习如何使用 Python 的 multiprocessing 包，但我不明白 map_async 和 imap 之间的区别。我注意到 map_async 和 imap 都是异步执行的。那么我什么时候应该使用其中一个呢？以及我应该如何检索 map_async 返回的结果？

我应该使用这样的东西吗？

def test():
    result = pool.map_async()
    pool.close()
    pool.join()
    return result.get()

result=test()
for i in result:
    print i

最佳答案

imap/imap_unordered 和 map/map_async 之间有两个主要区别:

他们使用您传递给他们的可迭代对象的方式。
他们将结果返回给您的方式。

map 通过将可迭代对象转换为列表(假设它还不是列表)、将其分成 block 并将这些 block 发送到 中的工作进程来使用您的可迭代对象池。将 iterable 分成 block 比在进程之间一次传递一个 item 的 iterable 中的每个项目执行得更好——尤其是在 iterable 很大的情况下。但是，将可迭代对象转换为列表以对其进行分 block 可能会产生非常高的内存成本，因为整个列表都需要保存在内存中。

imap 不会将您提供的可迭代对象转换为列表，也不会将其分成 block (默认情况下)。它将一次迭代一个可迭代的元素，并将它们每个发送到一个工作进程。这意味着您不会将整个可迭代对象转换为列表而对内存造成影响，但这也意味着大型可迭代对象的性能较慢，因为缺少分 block 。但是，可以通过传递大于默认值 1 的 chunksize 参数来缓解这种情况。

imap/imap_unordered 和 map/map_async 的另一个主要区别在于 imap/imap_unordered，您可以在工作人员准备好后立即开始接收结果，而不必等待所有工作人员完成。使用 map_async，会立即返回 AsyncResult，但在所有结果都被处理之前，您实际上无法从该对象中检索结果，此时它返回相同的结果map 的列表(map 实际上在内部实现为 map_async(...).get())。没有办法得到部分结果；你要么得到全部结果，要么什么都没有。

imap 和 imap_unordered 都立即返回可迭代对象。使用 imap，结果将在准备就绪后立即从可迭代对象中生成，同时仍保留输入可迭代对象的顺序。使用 imap_unordered，结果将在它们准备好后立即生成，而不管输入迭代的顺序如何。所以，假设你有这个:

import multiprocessing
import time

def func(x):
    time.sleep(x)
    return x + 2

if __name__ == "__main__":    
    p = multiprocessing.Pool()
    start = time.time()
    for x in p.imap(func, [1,5,3]):
        print("{} (Time elapsed: {}s)".format(x, int(time.time() - start)))

这将输出:

3 (Time elapsed: 1s)
7 (Time elapsed: 5s)
5 (Time elapsed: 5s)

如果你使用 p.imap_unordered 而不是 p.imap，你会看到:

3 (Time elapsed: 1s)
5 (Time elapsed: 3s)
7 (Time elapsed: 5s)

如果你使用 p.map 或 p.map_async().get()，你会看到:

3 (Time elapsed: 5s)
7 (Time elapsed: 5s)
5 (Time elapsed: 5s)

因此，使用 imap/imap_unordered 而不是 map_async 的主要原因是:

您的可迭代对象足够大，将其转换为列表会导致您耗尽/使用太多内存。
您希望能够在所有完成之前开始处理结果。

关于python - 多处理。池 : What's the difference between map_async and imap?，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/26520781/

python - 多处理。池 : What's the difference between map_async and imap?

上一篇：linux - 如何在 bash shell 脚本中包含文件

下一篇：linux - 如何在 bash 中检查文件是否创建时间超过 x 时间？