apache-flink - 我可以将 flink rocksDB 状态后端与本地文件系统一起使用吗?

标签 apache-flink rocksdb

我正在探索使用 Flink rocksDb 状态后端,文档似乎暗示我可以使用常规文件系统,例如:file:///data/flink/checkpoints,但代码仅 javadoc在这里提到了 hdfs 或 s3 选项。

我想知道是否可以将本地文件系统与 flink rocksdb 后端一起使用,谢谢!

Flink 文档:https://ci.apache.org/projects/flink/flink-docs-stable/ops/state/state_backends.html#the-rocksdbstatebackend

Flink 代码:https://github.com/apache/flink/blob/master/flink-state-backends/flink-statebackend-rocksdb/src/main/java/org/apache/flink/contrib/streaming/state/RocksDBStateBackend.java#L175

最佳答案

不,你不应该那样做!

使用此路径,您可以配置 Flink 写入检查点的目录。检查点是应用程序状态的副本,用于在发生故障(例如机器故障)时恢复应用程序状态。该路径必须指向一个持久的远程存储,以便能够在进程被终止或机器死亡的情况下读取检查点。如果将检查点写入失败机器的本地文件系统,您将无法恢复作业和恢复状态。

但是,如果这是也可以从其他机器挂载的 NFS(或任何其他远程存储)的挂载点,您可以将检查点写入本地路径。

关于apache-flink - 我可以将 flink rocksDB 状态后端与本地文件系统一起使用吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58614739/

相关文章:

java - Rocks DB 的 Java API 是否支持 API GetUpdatesSince?

java-native-interface - 为什么 Apache Kafka Streams 使用 RocksDB 以及如何改变它?

rocksdb - 我是否正确地强制 RocksDB 使用 fsync? fsync() 和 msync() 均未在 strace 中显示

streaming - 99% 延迟和吞吐量的含义是什么

apache-flink - Apache 弗林克 : How to apply multiple counting window functions?

java - ClassNotFoundException : org. apache.hadoop.conf.Configuration 启动 Flink SQL 客户端

java - Flinkrocksdb压缩过滤器不工作

RocksDb 不会为较小的表创建 SST 文件

apache-flink - 如何在 Flink 中对 String DataStream 执行 timeWindow()?

java - 使用 Apache Flink 中的 DataSet API 在每次迭代之前计算变量