Django + Celery + Apache mod_wsgi + Postgres + RabbitMQ 多个客户端的应用程序

我有一个 Django 应用程序，它使用 Celery、RabbitMQ 和 Apache mod_wsgi。目前全部都在一台服务器上。每个客户端都有自己的URL挂载，例如:

每个客户端都有自己的数据库和项目目录，其中包含用于 Django 设置的 local_setting.py。

我正在使用supervisord 来管理每个客户的 Celery Worker + Celery Beat。

随着我获得越来越多的客户，维护工作也会变得更加耗时。

我已经开始使用 Docker 来尝试简化部署，并可能跨多个主机进行扩展。

虽然设置 Docker Compose 为一个客户端运行一组服务非常容易，但我正在尝试找出易于管理的多个客户端的最佳方法，例如快速设置安装在主 URL 下的新客户端。

我认为 Postgres 数据库实例应该共享以保存每个客户端数据库，就像现在一样。并拥有一个共享的 NGIX 实例来处理 HTTP 端。对于每个客户端，使用一个 Kubernetes Pod，其中包含:

Gunicorn 来处理 Django
celery 节
celery worker
用于静态文件的轻量级 HTTP 服务器。

所以问题是，这是一个好方法还是有更好的方法来处理和处理这个问题？

我还想知道是否应该为每个客户构建一个镜像，因为这样可能更容易管理？

欢迎任何建议。

最佳答案

为此，我的建议是保持一个代码库和一台服务器运行(或同一 Django 应用程序的多个服务器，无需基于客户端进行任何自定义)。主要原因是维护更方便。您不想多次进行更改以向多个客户端提供功能。

由于您已经有一个 Django 应用程序，我认为最好利用该代码来适应上面给出的方法，并且对代码进行最少的更改。这意味着，您需要某种方法来处理连接到多个数据库的多个客户端。我建议是使用中间件和 database router 。像这样:(基于此 snippet 的代码)。

import threading

request_cfg = threading.local()

class RouterMiddleware (object):
    def process_view( self, request, view_func, args, kwargs ):
        if 'client' in kwargs:
            request_cfg.client = kwargs['client']
            request.client = client 
            # Here, we are adding client info with request object.
            # It will make the implementation bit easier because
            # then you can access client information anywhere in the view/template.

    def process_response( self, request, response ):
        if hasattr( request_cfg, 'client' ):
            del request_cfg.client
        return response

class DatabaseRouter (object):
    def _default_db( self ):
        from django.conf import settings
        if hasattr( request_cfg, 'client' ) and request_cfg.client in settings.DATABASES:
            return request_cfg.client            
        else:
            return None

    def db_for_read( self, model, **hints ):
        return self._default_db()

    def db_for_write( self, model, **hints ):
        return self._default_db()

然后将它们添加到settings.py:

DATABASES = {
    'default': {
        'NAME': 'user',
        'ENGINE': 'django.db.backends.postgresql',
        'USER': 'postgres_user',
        'PASSWORD': 's3krit'
    },
    'client1': {
        'NAME': 'client1',
        'ENGINE': 'django.db.backends.postgresql',
        'USER': 'postgres_user',
        'PASSWORD': 's3krit'
    },
    'client2': {
        'NAME': 'client2',
        'ENGINE': 'django.db.backends.postgresql',
        'USER': '_user',
        'PASSWORD': 'priv4te'
    }
}

DATABASE_ROUTERS = [
    'path.to.DatabaseRouter', 
]

MIDDLEWARE = [
    # middlewares
    'path.to.RouterMiddleware'
]

最后更新urls.py:

urlpatterns = [
    path('<str:client>/admin/', admin.site.urls),
    path('<str:client>/', include('client_app.urls')),
    # and so on
]

这种方法的优点是您不必为新客户端配置任何内容，您所需要做的就是在设置中添加新数据库并按照 documentation 中的描述运行迁移。无需配置反向代理服务器或其他任何东西。

现在，当涉及到在 celery 中处理任务时，您可以提供将使用哪个数据库来运行查询(引用 docs )。这是一个例子:

@app.task
def some_task():
    logger.info("-"*25)
    for db_name in settings.DATABASES.keys():
        Model.objects.using(db_name).filter(some_condition=True)
    logger.info("-"*25)

关于Django + Celery + Apache mod_wsgi + Postgres + RabbitMQ 多个客户端的应用程序，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63396649/

Django + Celery + Apache mod_wsgi + Postgres + RabbitMQ 多个客户端的应用程序

上一篇：docker - 在 Github 操作和查询中设置 Cassandra 容器

下一篇：apache-spark - 在 Google Colab 上安装 Spark 时出错