python - 从 celery 后端获取所有任务的列表

标签 python celery

我有一个 celery 应用程序,它使用后端来存储已完成任务的结果。

当任务排队/运行时,我可以获取有关它们的信息,但是在它们完成后,如何从结果后端获取所有任务 ID 的列表?

我想在 python 应用程序中以不依赖于特定后端的方式执行此操作(例如,我将来可能希望在文件系统和 MySQL 之间切换作为结果存储)。

最佳答案

我认为最好的解决方案是将有关已完成任务的信息存储在数据库中。首先,它易于加工。 这只是一个 SQLite 的示例。我们的任务表:

# You can add specific columns for args, kwargs etc.
# it is just an example 
CREATE TABLE celery_tasks (
    "id" INTEGER PRIMARY KEY,
    "task_id" TEXT NOT NULL,
    "task_name" TEXT NOT NULL,
    "state" TEXT NOT NULL,
    "created" TEXT NOT NULL
)

我们的 celery 应用程序tasks.py:

import celery
from celery.signals import task_postrun
from celery.task import Task
import sqlite3
from datetime import datetime


@task_postrun.connect()
def task_postrun(signal=None, sender=None, task_id=None, task=None,
                 args=None, kwargs=None, retval=None, state=None):
    # For example we don't want to store info about specific tasks 
    ignored_tasks = ('tasks.ignore_task', )

    if task.name not in ignored_tasks:
        # write info about a finished task into SQLite
        conn = sqlite3.connect('db')
        conn.execute(
            'INSERT INTO celery_tasks (task_id, task_name, state, created) VALUES (?,?,?,?)',
            (task_id, task.name, state, datetime.now())
        )

        conn.commit()
        conn.close()


app = celery.Celery(
   'tasks',
   broker='redis://localhost:6379/0',
   backend='redis://localhost:6379/0',
)


@app.task
def success_task():
    pass


@app.task
def failure_task():
    raise Exception('something wrong')


@app.task
def ignore_task():
    """
    Example of the task that we want to ignore for SQLite.
    """
    pass

run_tasks.py:

from tasks import success_task, failure_task, ignore_task

success_task.delay()
failure_task.delay()
ignore_task.delay()

因此,在此之后,您可以使用常规 SQL 查询在代码的任何位置获取有关已完成任务的任何信息。(SELECT * FROM celery_tasks WHERE 创建的 ... AND ...)

您也可以不时地清理 table 。 我认为使用 db 是实现此目的的一个很好的解决方案。

还有一种方法。

您可以配置CELERY_RESULT_BACKEND环境。在这种情况下,celery 将创建 celery_tasksetmetacelery_taskmeta 表。任务数据会自动实现:

app = Celery(
    'app_name',
    broker='CELERY_BROKER_URL...',
    backend='db+mysql://credentials...',
)

希望这有帮助。

关于python - 从 celery 后端获取所有任务的列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42836136/

相关文章:

python - 如何使用 Redis 作为代理清除 celery 队列中的任务

python - celery 任务链取消?

python - 给张量命名?

python - 如何在 matplotlib 中绘制多个 X 或 Y 轴?

python - 如何使用数据发生变化的位置索引 Pandas 数据框

python-3.x - Celery SQS 消费者上的填充不正确

python - celery 通过在 task_postrun 信号中提高 SystemExit 来尝试关闭 worker 但总是挂起并且主进程永远不会退出

python - Dask 中的索引存在数据左移 q 的问题

python - pgAdmin4 查询错误 "not enough values to unpack (expected 5, got 4)"

python - Celery:将每个任务运行记录到它自己的文件中?