airflow - 用 --mark_success 回填很慢

标签 airflow

我希望使用 -m 进行回填的行为或多或少会立即运行,因为没有完成任何工作。然而,我发现调度程序在每个任务上花费大约 30 秒,这似乎过多。

我在 local_executor 模式下以 Postgresql 作为数据库运行一个小型 Airflow 实例。

这是否反射(reflect)了您对 Airflow 回填的体验?您是否知道性能陷阱或加快速度的技巧?

最佳答案

我发现了一种加速方式:

--donot-pickle
Do not attempt to pickle the DAG object to send over to the workers, just tell the workers to run their version of the code

Default: False

https://airflow.apache.org/docs/apache-airflow/stable/cli-and-env-variables-ref.html#Named%20Arguments_repeat8

关于airflow - 用 --mark_success 回填很慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62575995/

相关文章:

python - 如何运行超过 10 万个任务的 Airflow dag?

python - 如何在 Windows 主机上从 apache Airflow 使用 DockerOperator

python - 损坏的 DAG : [/airflow/dags/a. py] 无法解密 `extra` 登录参数 = 无,FERNET_KEY 配置丢失

amazon-s3 - 使用 s3 连接和 s3 Hook 在 Airflow 上创建 boto3 s3 客户端

airflow - 如何捕获 Airflow 中调用的 DAG 中传递的 --conf 参数

python - 如何设置Airflow发送邮件?

airflow - 我可以通过向 Airflow 中的运算符添加更多 CPU 来提高处理速度吗?

python - 在模板化 bash 命令中通过 {{ run_id }} 在 Apache Airflow 中生成人类可读的文件名

airflow - 是否可以在 UI 中 'tag' Airflow DAG?