java - 卡夫卡 : events published from the host machine are not consumed by the application running in Docker

标签 java docker apache-kafka docker-compose apache-zookeeper

我正在为应用程序编写端到端测试。我启动了一个应用程序实例、一个 Kafka 实例和一个 Zookeeper(全部 Dockerized),然后我与应用程序 API 交互以测试其功能。我需要在此应用程序中测试事件使用者的功能。我从我的测试中发布事件,应用程序应该处理它们。

问题:如果我在本地(而不是在 Docker 中)运行应用程序并运行会产生事件的测试,应用程序代码中的使用者会正确处理事件。在这种情况下,消费者和测试将 bootstrapServers 设置为 localhost:9092。但是,如果应用程序作为 Dockerized 实例运行,则它看不到事件。在这种情况下,bootstrapServers 在应用程序中设置为 kafka:9092,在测试中设置为 localhost:9092,其中 kafka是 Docker 容器名称。 kafka 容器向主机公开其 9092 端口,以便可以从 Docker 容器内部和主机(运行我的测试)访问相同的 Kafka 实例。

代码中的唯一区别是 localhostkafka 设置为引导服务器。在这两种情况下,消费者和生产者都成功启动;事件发布没有错误。只是在一种情况下消费者没有收到事件。

问题:如何让 Dockerized 消费者看到主机发布的事件?

注意:我有一个正确配置的 Docker 网络,其中包括应用程序实例、Zookeeper 和 Kafka。他们都“看到”对方。 kafkazookeeper 对应的端口暴露给主机。 Kafka 端口:0.0.0.0:9092->9092/tcp。 Zookeeper 端口:22/tcp、2888/tcp、3888/tcp、0.0.0.0:2181->2181/tcp

我正在使用 wurstmeister/kafkawurstmeister/zookeeper Docker 镜像(我无法替换它们)。

欢迎任何想法/想法。你会如何调试它?

更新:问题出在 KAFKA_ADVERTISED_LISTENERSKAFKA_LISTENERS env 变量上,它们被设置为用于 INSIDE 和 OUTSIDE 通信的不同端口。解决方案是在 Docker 容器内运行时在应用程序代码中使用正确的端口。

最佳答案

此类问题通常与 Kafka 处理代理地址的方式有关。

当您启动 Kafka 代理时,它会将自己绑定(bind)到 0.0.0.0:9092 上并使用地址 <hostname>:9092 在 Zookeeper 上注册自己.当您连接到客户端时,将联系 Zookeeper 以获取特定代理的地址。

这意味着当您启动 Kafka 容器时,您会遇到如下情况:

  • 容器名称:kafka
  • 网络名称:kafkanet
  • 主机名:kafka
  • 在 zookeeper 上注册:kafka:9092

现在,如果您将客户端从 kafkanet 网络中的容器连接到您的 Kafka,您从 Zookeeper 返回的地址是 kafka:9092可以通过 kafkanet 解决网络。

但是,如果您从 docker 外部连接到 Kafka(即使用 docker 映射的 localhost:9092 端点),您仍然会返回 kafka:9092不可解析的地址。

为了解决这个问题,您可以指定 advertised.host.nameadvertised.port在代理配置中,地址可由所有客户端解析 ( see documentation )。

通常做的是设置advertised.host.name作为<container-name>.<network> (在您的情况下,类似于 kafka.kafkanet),以便连接到网络的任何容器都能够正确解析 Kafka 代理的 IP。

然而,在您的情况下,您有一个混合网络配置,因为一些组件位于 docker 内部(因此能够解析 kafkanet 网络),而其他组件则位于 docker 外部。如果它是一个生产系统,我的建议是设置 advertised.host.name到主机的 DNS/IP,并始终依赖 docker 端口映射来访问 Kafka 代理。

然而,根据我的理解,你只需要这个设置来测试,所以最简单的事情就是“欺骗”docker 之外的系统。使用上面指定的命名,这意味着只需添加到您的 /etc/hosts (或 Windows 等效项)行 127.0.0.1 kafka.kafkanet .

这样,当您住在 docker 外部的客户端连接到 Kafka 时,应该会发生以下情况:

  1. 客户端 -> Kafka 通过 localhost:9092
  2. kafka查询Zookeeper并返回主机kafka.kafkanet
  3. 客户解析kafka.kafkanet到 127.0.0.1
  4. 客户端 -> Kafka 通过 127.0.0.1:9092

编辑

正如评论中指出的那样,较新的 Kafka 版本现在使用 listeners 的概念和 advertised.listeners用于代替 host.nameadvertised.host.name (已弃用,仅在未指定上述内容的情况下使用)。然而,总体思路是相同的:

  • host.name : 指定 Kafka 代理应将自身绑定(bind)到的主机(与 port
  • 结合使用
  • listeners : 指定 Kafka 代理应绑定(bind)的所有端点(例如 PLAINTEXT://0.0.0.0:9092,SSL://0.0.0.0:9091 )
  • advertised.host.name : 指定如何将代理通告给客户端(即客户端应使用哪个地址连接到它)
  • avertised.listeners : 指定所有通告的端点(例如 PLAINTEXT://kafka.example.com:9092,SSL://kafka.example.com:9091 )

在这两种情况下,为了使客户端能够成功地与 Kafka 通信,他们需要能够解析并连接到 advertised主机名和端口。

在这两种情况下,如果未指定,它们都是由代理使用运行代理的机器的主机名自动派生的。

关于java - 卡夫卡 : events published from the host machine are not consumed by the application running in Docker,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64283594/

相关文章:

java - Mysql数据导出工具

apache-kafka - Apache 卡夫卡 : TimeoutException and then nothing works‏

apache-kafka - Spring kafka 和 Kafka 集群

docker - 我可以在docker容器中使用pppoe吗?

azure - 如何在 Raspberry Pi 上将 Azure Functions 作为 IoT Edge 模块运行?

java - 在 maven 的 docker 中运行的 mysql 图像上的 liquibase 脚本用于集成测试

node.js - 无法让我的 Node 应用程序使用单独的 docker compose 文件连接到 kafka

java - 如何在 eclipse : without maven? 的 checkStyle 中使用自定义检查

java - 打印与时间相关的字符串,如 "today"和 "yesterday"根据区域设置翻译?

java - 找不到类,未找到类定义