python-3.x - Python 的 map_async 如何保持结果有序?

标签 python-3.x multiprocessing

我正在尝试探索 Python 的 py3.3 多处理库,我注意到 map_async 中有一个奇怪的结果。我无法解释的功能。我一直期望从回调中存储的结果是“乱序的”。也就是说,如果我向工作进程提供许多任务,一些任务应该在其他任务之前完成,不一定按照它们被输入或存在于输入列表中的相同顺序。但是,我得到了一组与输入任务完全对应的有序结果。即使在故意试图通过减慢某些进程来“破坏”某些进程(这可能会允许其他进程在它之前完成)之后也是如此。

我在 calculate 中有一个打印声明显示它们被无序计算的函数,但 结果仍然井然有序。虽然我不确定我是否可以相信打印语句是一个很好的指标,表明事情实际上是在乱序计算。

测试过程(一般例子):
建立一个对象列表,每个对象都包含一个整数。
将该对象列表作为参数提交给 map_async,以及更新对象的 numValue 属性和平方值的函数“calculate”。
然后“计算”函数返回具有更新值的对象。

一些代码:

import time
import multiprocessing
import random

class NumberHolder():
    def __init__(self,numValue):
        self.numValue = numValue    #Only one attribute

def calculate(obj):
    if random.random() >= 0.5:
        startTime = time.time()
        timeWaster = [random.random() for x in range(5000000)] #Waste time.
        endTime = time.time()           #Establish end time
        print("%d object got stuck in here for %f seconds"%(obj.numValue,endTime-startTime))

#Main Process
if __name__ == '__main__':
    numbersToSquare = [x for x in range(0,100)]     #I'm 
    taskList = []

    for eachNumber in numbersToSquare:
        taskList.append(NumberHolder(eachNumber))   #Create a list of objects whose numValue is equal to the numbers we want to square

    results = [] #Where the results will be stored
    pool = multiprocessing.Pool(processes=(multiprocessing.cpu_count() - 1)) #Don't use all my processing power.
    r = pool.map_async(calculate, taskList, callback=results.append)  #Using fxn "calculate", feed taskList, and values stored in "results" list
    r.wait()                # Wait on the results from the map_async

results = results[0]    #All of the entries only exist in the first offset
for eachObject in results:      #Loop through them and show them
    print(eachObject.numValue)          #If they calc'd "out of order", I'd expect append out of order

我发现了这个写得很好的响应,它似乎支持 map_async 可以产生“乱序”结果的想法:multiprocessing.Pool: When to use apply, apply_async or map? .我还在这里查阅了文档 (http://docs.python.org/3.3/library/multiprocessing.html)。对于 map_async 它说这个方法“......如果指定了回调,那么它应该是一个接受单个参数的可调用。当结果准备好时,回调将应用于它(除非调用失败)。回调应该立即完成,否则处理结果的线程将被阻塞”

我是否误解了这应该如何工作?任何帮助深表感谢。

最佳答案

这是预期的行为。文档说:

A variant of the map() method which returns a result object.



“结果对象”只是一个保存计算结果的容器类。当您调用 r.wait() ,您要等到所有结果都汇总并整理好。即使它不按顺序处理任务,结果仍将按原始顺序排列。

如果您希望在计算结果时产生结果,请使用 imap_unordered .

关于python-3.x - Python 的 map_async 如何保持结果有序?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19690517/

相关文章:

python - 如何使用 map 多处理 Pandas 数据框?

python - 属性错误 : '_MainProcess' object has no attribute '_exiting'

Python多处理池: how to join the reasults in a parallel way?

python - 单词中字母出现的频率

python - Coinbase Python API 上的分页

python - 根据国家/地区名称创建标志 URL 列

ios - 解决iOS ARM弱内存写排序的内存障碍?

python - 如何在 Python 中习惯性地对嵌套字典键进行排序

python - 删除日期时间是特定时间之间的特定日期的行

c++ - 实现多进程日志记录的最佳方式(C++)