python - Docker内的多处理python程序

标签 python docker python-multiprocessing

我正在尝试在 docker 容器内测试 python 的多处理,但即使成功创建了进程(我有 8 个 CPU 并创建了 8 个进程),它们也总是只占用一个物理 CPU。 这是我的代码:

from sklearn.externals.joblib.parallel import Parallel, delayed
import multiprocessing
import pandas
import numpy
from scipy.stats import linregress
import random
import logging

def applyParallel(dfGrouped, func):
    retLst = Parallel(n_jobs=multiprocessing.cpu_count())(delayed(func)(group) for name, group in dfGrouped)
    return pandas.concat(retLst)

def compute_regression(df):
    result = {}

    (slope,intercept,rvalue,pvalue,stderr) = linregress(df.date,df.value)
    result["slope"] = [slope]
    result["intercept"] = [intercept]

    return pandas.DataFrame(result)

if __name__ == '__main__':
    logging.basicConfig(level=logging.DEBUG,
                    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s')
    logging.info("start")
    random_list = []
    for i in range(1,10000):
        for j in range(1,100):
            random_list.append({"id":i,"date":j,"value":random.random()})

    df = pandas.DataFrame(random_list)

    df = applyParallel(df.groupby('id'), compute_regression)

    logging.info("end")

我在启动时尝试了多个 docker 选项,例如 --cpus 或 --cpuset,但它始终只使用 1 个物理 CPU。 这是 Docker、python、操作系统中的问题吗? Docker 版本是 1.13.1

cpu_count()的结果:

>>> import multiprocessing
>>> multiprocessing.cpu_count()
8

在运行期间,这是一个顶部。我们可以看到主进程和 8 个子进程,但我发现百分比很奇怪。 top screenshot

然后,如果我更改为 4 个进程,则使用的 CPU 总量始终相同: top with 4 threads

最佳答案

来自 https://docs.docker.com/get-started - “从根本上说,容器只不过是一个正在运行的进程,它应用了一些附加的封装功能,以使其与主机和其他容器隔离。”

Docker 在主机上运行。该主机(或虚拟机)具有一定数量的物理(或虚拟)CPU。原因multiprocessing.cpu_count()在您的情况下显示 8 是因为这是您的系统拥有的 CPU 数量。使用 docker 选项,如 --cpus--cpuset-cpus不会改变你机器的硬件,这就是 cpu_count()正在报告。

在我当前的系统上:

# native
$ python -c 'import multiprocessing as mp; print(mp.cpu_count())'
12
# docker
$ docker run -it --rm --cpus 1 --cpuset-cpus 0 python python -c 'import multiprocessing as mp; print(mp.cpu_count())'
12

来自 https://docs.docker.com/config/containers/resource_constraints/#cpu - “默认情况下,每个容器对宿主机 CPU 周期的访问是无限制的。” 但是您可以使用 --cpus 之类的选项来限制容器。或 --cpuset-cpus .

--cpus可以是一个 float ,最大为可用物理 CPU 的数量。您可以将此数字视为分数中的分子 <--cpus arg>/<physical CPU's> .如果您有 8 个物理 CPU 并指定 --cpus 4 ,您要告诉 docker 使用的 CPU 不超过总 CPU 的 50% (4/8)。 --cpus 1.5将使用 18.75% (1.5/8)。

--cpuset-cpus实际上确实限制了要使用的物理/虚拟 CPU。

(Docker 的文档中还介绍了许多其他与 CPU 相关的选项。)

这是一个较小的代码示例:

import logging
import multiprocessing
import sys

import psutil
from joblib.parallel import Parallel, delayed

def get_logger():
    logger = logging.getLogger()
    if not logger.hasHandlers():
        handler = logging.StreamHandler(sys.stdout)
        formatter = logging.Formatter("[%(process)d/%(processName)s] %(message)s")
        handler.setFormatter(formatter)
        handler.setLevel(logging.DEBUG)
        logger.addHandler(handler)
        logger.setLevel(logging.DEBUG)
    return logger

def fn1(n):
    get_logger().debug("fn1(%d); cpu# %d", n, psutil.Process().cpu_num())

if __name__ == "__main__":
    get_logger().debug("main")
    Parallel(n_jobs=multiprocessing.cpu_count())(delayed(fn1)(n) for n in range(1, 101))

在本地和在 docker 中运行它会记录如下行:

[21/LokyProcess-2] fn1(81); cpu# 11
[28/LokyProcess-9] fn1(82); cpu# 6
[29/LokyProcess-10] fn1(83); cpu# 2
[31/LokyProcess-12] fn1(84); cpu# 0
[22/LokyProcess-3] fn1(85); cpu# 3
[23/LokyProcess-4] fn1(86); cpu# 1
[20/LokyProcess-1] fn1(87); cpu# 7
[25/LokyProcess-6] fn1(88); cpu# 3
[27/LokyProcess-8] fn1(89); cpu# 4
[21/LokyProcess-2] fn1(90); cpu# 9
[28/LokyProcess-9] fn1(91); cpu# 10
[26/LokyProcess-7] fn1(92); cpu# 11
[22/LokyProcess-3] fn1(95); cpu# 9
[29/LokyProcess-10] fn1(93); cpu# 2
[24/LokyProcess-5] fn1(94); cpu# 10
[23/LokyProcess-4] fn1(96); cpu# 1
[20/LokyProcess-1] fn1(97); cpu# 9
[23/LokyProcess-4] fn1(98); cpu# 1
[27/LokyProcess-8] fn1(99); cpu# 4
[21/LokyProcess-2] fn1(100); cpu# 5

请注意,我的系统上的所有 12 个 CPU 都在使用中。 请注意

  • 多个进程使用相同的物理 CPU(进程号 22 和 25 的 cpu#3)
  • 一个单独的进程可以使用多个 CPU(进程 #21 使用 CPU # 的 11 和 9)

使用 docker run --cpus 1 ... 运行相同的程序仍然会导致所有 12 个进程都使用所有 12 个 CPU,就像不存在 --cpus 参数一样。它只是限制了 docker 允许使用的总 CPU 时间的百分比。

使用 docker run --cpusets-cpus 0-1 ... 运行相同的程序将导致启动的所有 12 个进程仅使用 2 个物理 CPU:

[11/LokyProcess-2] fn1(35); cpu# 0
[11/LokyProcess-2] fn1(36); cpu# 0
[12/LokyProcess-3] fn1(37); cpu# 1
[11/LokyProcess-2] fn1(38); cpu# 0
[15/LokyProcess-6] fn1(39); cpu# 1
[17/LokyProcess-8] fn1(40); cpu# 0
[11/LokyProcess-2] fn1(41); cpu# 0
[10/LokyProcess-1] fn1(42); cpu# 1
[11/LokyProcess-2] fn1(43); cpu# 1
[13/LokyProcess-4] fn1(44); cpu# 1
[12/LokyProcess-3] fn1(45); cpu# 0
[12/LokyProcess-3] fn1(46); cpu# 1

要回答“它们总是只占用一个物理 CPU”这句话——这只有在 --cpusets-cpus arg 正好/只有 1 个 CPU。


(附带说明——示例中设置日志记录的原因是因为 joblib 中的 open bug。)

关于python - Docker内的多处理python程序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47989418/

相关文章:

jquery - 使用 jquery ajax 捕获 401 未经授权的 http 响应

docker - 如何在构建期间通过 cloudbuild.yaml 正确获取/设置环境变量?

python - 子流程的执行顺序及其对操作原子性的影响

docker - docker compose中服务和容器的区别

Python多处理一次读取输入迭代器

python - 为什么 multiprocessing.Queue 没有 task_done 方法

javascript - 如何在 Javascript/Python/Django 中向数字添加千位分隔符

python - 正则表达式 : Efficiently matching words that are the same except for last character

python - 如何停止从打印到 stderr 的 Django 单元测试记录?

docker - Docker Compose v3 中的 volumes_from 等价物