甚至没有文件打开时，Python 多处理声称打开的文件太多

我正在尝试加速使用巨大矩阵的算法。我已经将它并行化以对行进行操作，并将数据矩阵放在共享内存中，这样系统就不会被阻塞。然而，它并没有像我希望的那样顺利地工作，现在它抛出了一个关于文件的奇怪错误，我不理解这个错误，因为我什至没有在里面打开文件。

程序中大致发生的事情的模型，1000 次迭代也代表算法中发生的事情。

import multiprocessing
import ctypes
import numpy as np

shared_array_base = multiprocessing.Array(ctypes.c_double, 10*10)
shared_array = np.ctypeslib.as_array(shared_array_base.get_obj())
shared_array = shared_array.reshape(10, 10)

def my_func(i, shared_array):
    shared_array[i,:] = i

def pool_init(_shared_array, _constans):
    global shared_array, constans
    shared_array = _shared_array
    constans = _constans

def pool_my_func(i):
    my_func(i, shared_array)

if __name__ == '__main__':
    for i in np.arange(1000):
        pool = multiprocessing.Pool(8, pool_init, (shared_array, 4))
        pool.map(pool_my_func, range(10))
    print(shared_array)

这会引发此错误(我在 OSX 上):

Traceback (most recent call last):
  File "weird.py", line 24, in <module>
    pool = multiprocessing.Pool(8, pool_init, (shared_array, 4))
  File "//anaconda/lib/python3.4/multiprocessing/context.py", line 118, in Pool
    context=self.get_context())
  File "//anaconda/lib/python3.4/multiprocessing/pool.py", line 168, in __init__
    self._repopulate_pool()
  File "//anaconda/lib/python3.4/multiprocessing/pool.py", line 233, in _repopulate_pool
    w.start()
  File "//anaconda/lib/python3.4/multiprocessing/process.py", line 105, in start
    self._popen = self._Popen(self)
  File "//anaconda/lib/python3.4/multiprocessing/context.py", line 267, in _Popen
    return Popen(process_obj)
  File "//anaconda/lib/python3.4/multiprocessing/popen_fork.py", line 21, in __init__
    self._launch(process_obj)
  File "//anaconda/lib/python3.4/multiprocessing/popen_fork.py", line 69, in _launch
    parent_r, child_w = os.pipe()
OSError: [Errno 24] Too many open files

我很困惑。我什至不在这里打开文件。我想要做的就是以不会阻塞系统内存的方式将 shared_array 传递给各个进程，如果这有任何帮助，我什至不需要在并行进程中修改它。

此外，如果重要的话，正确代码本身抛出的确切错误会略有不同:

Traceback (most recent call last):
  File "tcap.py", line 206, in <module>
  File "tcap.py", line 202, in main
  File "tcap.py", line 181, in tcap_cluster
  File "tcap.py", line 133, in ap_step
  File "//anaconda/lib/python3.4/multiprocessing/context.py", line 118, in Pool
  File "//anaconda/lib/python3.4/multiprocessing/pool.py", line 168, in __init__
  File "//anaconda/lib/python3.4/multiprocessing/pool.py", line 233, in _repopulate_pool
  File "//anaconda/lib/python3.4/multiprocessing/process.py", line 105, in start
  File "//anaconda/lib/python3.4/multiprocessing/context.py", line 267, in _Popen
  File "//anaconda/lib/python3.4/multiprocessing/popen_fork.py", line 21, in __init__
  File "//anaconda/lib/python3.4/multiprocessing/popen_fork.py", line 69, in _launch
OSError: [Errno 24] Too many open files

是的，我不知道如何进行。任何帮助，将不胜感激。提前致谢!

最佳答案

您正在尝试创建 1000 个进程池，这些进程池未被回收(出于某种原因)；这些已经消耗了主进程中所有可用的文件描述符，用于在主进程与其子进程之间进行通信的管道。

也许你想使用:

pool = multiprocessing.Pool(8, pool_init, (shared_array, 4))
for _ in range(1000):
    pool.map(pool_my_func, range(10))

关于甚至没有文件打开时，Python 多处理声称打开的文件太多，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36596805/

甚至没有文件打开时，Python 多处理声称打开的文件太多

上一篇：python - Pandas 数据框中列的输出从 float 到货币(负值)

下一篇：python - python 如何将 unicode 和非 unicode 元组视为平等的？