airflow - 使用自定义状态标记 Airflow 任务

标签 airflow

我试图创建一个只有一项任务的 dag。我可以将任务标记为所需状态(例如已跳过或无状态)吗?

要求:一般来说,我会每隔一分钟查看一次 s3 存储桶,如果文件可用,我会进行一些处理。否则我就离开。我想在用户界面中看到这种可见性。所以。我试图将任务状态标记为已跳过。

这是正确的做法吗?我们还有其他方法来实现这一目标

谢谢

最佳答案

如果您想将任务标记为已跳过,可以引发 AirflowSkipException。当引发时,任务的执行将停止,并且任务将被标记为已跳过。

This example Airflow dag DummySkipOperator 演示了一个通过引发上述异常而被标记为已跳过的运算符。

关于airflow - 使用自定义状态标记 Airflow 任务,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56740078/

相关文章:

Airflow EmailOperator 抛出 "smtplib.SMTPNotSupportedError: STARTTLS extension not supported by server"?

airflow - 如何使用 Airflow 将最新文件从 s3 存储桶下载到本地计算机

docker - 是否可以将本地测试docker-airflow环境链接到GCP上的现有Airflow?

python - 如何从谷歌云 Composer 调用云功能?

airflow - 如何在 Apache Airflow 中重新运行所有失败的任务?

python - 将参数从 BranchPythonOperator 传递到 PythonOperator

python-3.x - 将网络服务器作为守护进程运行时无法识别 Airflow dag

pycharm - 获取 Pycharm 以查看动态生成的 python 模块

python - 通过 'for' 循环实例化多个任务时出现 Airflow 依赖错误

airflow - 读取 XCOM 和 Airflow 变量可能会减慢 Airflow(在 Google Cloud Composer 中)