apache-kafka-connect - Kafka 源连接器获取过时的偏移值

标签 apache-kafka-connect

我有一个 SourceTask,它有一个简单的 poll 方法(完成得相当快)。我发现从 context.offsetStorageReader 获取的 offsets 值大部分是陈旧的,这意味着与之前 poll() 方法返回的 offsets 值不匹配。

同时,我可以从日志中观察到,只有在发生“commitOffsets success”时,偏移值才会更新为“fresh”。

我的问题是:这是故意设计的吗?我应该减少“OFFSET_COMMIT_INTERVAL_MS_CONFIG”值以确保偏移量的提交速度快于执行的 SourceTask.poll() 方法吗?

最佳答案

org.apache.kafka.connect.runtime.OffsetStorageWriter 类的注释表示“偏移数据只能在任务启动或重新配置期间读取...”,而不是在每次执行 poll() 方法时读取。

关于apache-kafka-connect - Kafka 源连接器获取过时的偏移值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46401701/

相关文章:

elasticsearch - Kafka 连接 ElasticSearch 接收器 - 使用 if-else block 来提取和转换不同主题的字段

apache-kafka - 是否有 Kafka Producer API 配置来设置主题自动创建?

docker - 将 jar 添加到 Confluence Docker 中的常规 Kafka Connect 类路径

java - 重启数据库后尝试重启 debezium mysql 连接器时出错

elasticsearch - kafka-connect-elasticsearch : When using "write.method" as upsert, 是否可以在 kafka 主题上使用相同的 AVRO 对象发送部分文档?

postgresql - Debezium 是否提供交货和订购保证?

apache-kafka - 如何使用kafka sink向kafka主题发送数据?

java - Kafka 流消费为 CSV

twitter - 如何将 Twitter Heron 与 Storm Flux 结合使用

java - 无法在 Kafka Connect 2.4 中成功覆盖我的连接器