apache-kafka - Apache Flink State Store 与 Kafka Streams

标签 apache-kafka apache-flink apache-kafka-streams stream-processing

据我所知,处理 Kafka Streams 的本地状态在内存、磁盘或 Kafka 主题中,因为所有输入日期都来自一个分区,其中所有消息都由定义的值作为键。大多数时候,可以在不知道其他处理器状态的情况下完成计算。如果是,则您有另一个计算结果的 Streams 实例。就像这张照片:

enter image description here

Flink 的 States 到底存储在哪里? Flink 是否也可以将状态存储在本地,还是始终将状态发布到所有实例(任务)?是否可以配置 Flink 以便将状态存储在 Kafka Broker 中?

最佳答案

Flink 也使用本地存储(可以键控),类似于 Kafka Streams。但是,它不会将状态写入 Kafka 主题。

为了容错,它采用所谓的“分布式快照”,存储在可配置的状态后端(例如,HDFS)中。

查看文档了解更多详情:

关于apache-kafka - Apache Flink State Store 与 Kafka Streams,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54608133/

相关文章:

apache-kafka - -IV0 版本后缀是什么意思?

多种类型时的 Scala 方差

java - Apache Flink 与 Hadoop 2.8.0 结合使用进行 S3A 路径样式访问

apache-kafka - 镜像重新分区主题的大小不断增加

apache-kafka - 去抖kafka事件

apache-kafka - 卡夫卡流 : use the same `application.id` to consume from multiple topics

apache-kafka - Kafka Streams - 跳跃窗口 - 去重 key

apache-kafka - 卡夫卡流 : How to fix Serde casting error

apache-kafka - 如何将现有的 kafka 主题分区分散到更多目录中?

java - AbstractCassandraTupleSink 的实现不可序列化