airflow - Apache Airflow 集群的最低硬件要求

标签 airflow airflow-scheduler

设置 Apache Airflow 集群的最低硬件要求是什么。
例如。集群中不同类型节点的 RAM、CPU、磁盘等。

最佳答案

我在伪分布式模式(32 个并行工作线程;Postgres 后端)下使用非常小的实例没有任何问题:

  • 内存 4096 MB
  • CPU 1000 MHz
  • VCPU 2 个 VCPU
  • 磁盘 40 GB

  • 如果你想要分布式模式,如果你保持同质化,你应该很好。无论如何, Airflow 不应该真正做繁重的工作;将工作负载推向其他事物(Spark、EMR、BigQuery 等)。

    您还必须运行某种消息队列,例如 RabbitMQ。我认为他们也采用 Redis。但是,这并不会真正显着影响您的尺寸。

    关于airflow - Apache Airflow 集群的最低硬件要求,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47277180/

    相关文章:

    python - Airflow ,标记任务成功或在 dag 运行之前跳过它

    python - 使用 Airflow hive 运算符并输出到文本文件

    python - Airflow : ExternalTaskSensor doesn't trigger the task

    airflow - 将代码分发到 Airflow 网络服务器/调度程序+工作人员和工作流的最佳方式

    python - Airflow DockerOperator : connect sock. connect(self.unix_socket)FileNotFoundError:[错误2]没有这样的文件或目录

    python - 是否可以将用户输入从 dag 传递到 Airflow 中的子 dag?

    etl - Airflow 保留相同的数据库连接吗?

    python - Apache Airflow 中调度程序间隔和启动时间的工作不正确

    git - 执行 docker-compose : Building webserver unable to prepare context: unable to 'git clone' to temporary context directory: error fetching 时出错

    airflow - Airflow :PythonOperator:为什么要包含 'ds' arg?