我在玩Kafka-Connect .我有 HDFS connector
在 stand-alone mode 工作和 distributed mode .
他们advertise可以通过 YARN
管理工作人员(负责运行连接器)但是,我还没有看到任何描述如何实现这一目标的文档。
我该如何获得 YARN
执行 worker ?如果没有具体的方法,是否有关于如何让应用程序在 YARN
内运行的通用方法? ?
我用过YARN
使用 SPARK 使用 spark-submit
但是,我无法弄清楚如何让连接器在 YARN
中运行.
最佳答案
理论上你可以在 YARN 上运行任何东西,甚至是一个简单的 hello world 程序。这就是为什么说 Kafka-Connect 在 YARN 上运行在技术上是正确的。需要注意的是,让 Kafka-Connect 在 YARN 上运行目前需要大量的肘部油脂。有两种方法可以做到:
slider
您必须阅读大量文档才能使其正常工作,但 Slider 背后的想法是,您可以让任何程序在 YARN 上运行,而无需处理 YARN API 并通过执行以下操作编写 YARN 应用程序主控:
Slider 为您处理容器部署和故障容器的恢复,这很好。当 YARN 3.0 发布时,Slider 也成为 YARN 的原生部分。
备择方案
顺便说一句,让 Kafka-Connect 部署在 Kubernetes 或 Mesos/Marathon 上可能会更容易。这样做的基本工作流程是:
教程
关于apache-kafka - 如何在 YARN 中运行 Kafka 连接 worker ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34861593/