Python 多处理池 - 迭代对象方法?

标签 python multiprocessing

也许更精通 Python 的多处理池代码的人可以帮助我。我正在尝试通过套接字连接同时连接到我网络上的多个主机(任何时候都连接 N 个)并执行一些 RPC。当一个主机完成时,我想将下一个主机添加到池中运行,直到所有主机都完成。

我有一个类,HClass,有一些这样做的方法,以及主机列表中包含的主机名列表。但是我无法理解 Pool 的任何 docs.python.org 示例以使其正常工作。

一小段代码来说明我到目前为止所得到的:

hostlist = [h1, h2, h3, h4, ....]
poolsize = 2

class HClass:
  def __init__(self, hostname="default"):
    self.hostname = hostname

  def go(self):
      # do stuff
      # do more stuff
  ....

if __name__ == "__main__":
  objs = [HClass(hostname=current_host) for current_host in hostlist]
  pool = multiprocessing.pool(poolsize)
  results = pool.apply_async(objs.go())

到目前为止,我很幸运有这个回溯:

Exception in thread Thread-2:
Traceback (most recent call last):
  File "/usr/lib/python2.7/threading.py", line 551, in __bootstrap_inner
    self.run()
  File "/usr/lib/python2.7/threading.py", line 504, in run
    self.__target(*self.__args, **self.__kwargs)
  File "/usr/lib/python2.7/multiprocessing/pool.py", line 319, in _handle_tasks
    put(task)
PicklingError: Can't pickle <type 'generator'>: attribute lookup __builtin__.generator failed

进程一直挂起,直到我按 Control-C 退出。

最佳答案

我会尽量减少进程间通信。看起来您真正需要发送的只是主机名字符串:

for host in hostlist:
    pool.apply_async(worker, args = (host,), callback = on_return)

例如,

import multiprocessing as mp
import time
import logging

logger = mp.log_to_stderr(logging.INFO)

hostlist = ['h1', 'h2', 'h3', 'h4']*3
poolsize = 2

class HClass:
    def __init__(self, hostname="default"):
        self.hostname = hostname

    def go(self):
        logger.info('processing {h}'.format(h = self.hostname))
        time.sleep(1)
        return self.hostname

def worker(host):
    h = HClass(hostname = host)
    return h.go()

result = []
def on_return(retval):
    result.append(retval)

if __name__ == "__main__":
    pool = mp.Pool(poolsize)
    for host in hostlist:
        pool.apply_async(worker, args = (host,), callback = on_return)
    pool.close()
    pool.join()
    logger.info(result)

关于Python 多处理池 - 迭代对象方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14116502/

相关文章:

python - 我可以可视化 datasets.Dataset 的内容吗?

python - 为什么将 Django 1.7c2 升级到 1.7c3 会创建新的数据库迁移?

python - 用于基于函数的 View 的 Django Rest Framework

Python计算快,串口写入慢: Multithread or Multiprocess

android - 如何在自己的进程中使用库向 Android 应用程序添加分析

php 一些 fork 进程继续运行

python - 如何在 SQLAlchemy 中为列插入数据库的默认值?

python - 将数据结构持久保存到python中的文件的最简单方法?

java - python和java之间的IPC(进程间通信)

c++ - 不同的进程使用相同的 xml 文件