apache-kafka - FlinkKafkaConsumer在HiBench中的容错

标签 apache-kafka intel apache-flink flink-streaming fault-tolerance

我正在运行一些实验来测试 Apache Flink 的容错能力。我目前正在使用 HiBench 框架和为 Flink 实现的 WordCount 微型基准测试。

我注意到,如果我在执行过程中杀死了一个 TaskManager,Flink 操作符的状态会在自动“重新部署”后恢复,但是从基准测试发送到 Kafka 的许多(全部?)元组会丢失(存储在 Kafka 中但不存储在 Kafka 中)在 Flink 中接收)。

似乎在恢复之后,FlinkKafkaConsumer(基准测试使用 FlinkKafkaConsumer08)代替了从失败前读取的最后一个偏移量开始读取,从最新的可用偏移量开始读取(丢失所有事件)在失败期间发送)。

有什么建议吗?

谢谢!

最佳答案

问题出在 HiBench 框架本身和最新版本的 Flink 上。

为了在 Kafka 消费者中使用“setStartFromGroupOffsets()”方法,我必须更新基准测试中的 Flink 版本。

关于apache-kafka - FlinkKafkaConsumer在HiBench中的容错,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49697590/

相关文章:

macos - 关闭 6 核 Intel Xeon 中的超线程

performance - Intel x86 处理器的 L1 内存缓存记录在哪里?

java - Flink 抛出 com.esotericsoftware.kryo.KryoException : java. lang.NullPointerException

kubernetes - 强制 Apache Flink 失败并从检查点恢复其状态

scala - 在 Scala 中找不到 RestHighLevelClient

apache-kafka - Spring Kafka 消费者 - 云端并发监听器与非并发监听器

hadoop - 卡夫卡|无法将数据发布到代理-ClosedChannelException

c - 用于优化给定 CPU 架构的 GCC 选项

apache-kafka - 在 Kafka 上实现事件溯源架构

java - 多处理kafka消息