distributed-computing - CRDT 和 RAFT 协议(protocol)之间是否存在关系——或者它们是正交的?

标签 distributed-computing distributed-system raft shared-state crdt

以多人网络游戏为例。您立即就会遇到在网络上复制和协调共享状态的问题。

似乎有多种工具针对此问题的某个方面,其中两个似乎有重叠:

  1. Conflict-free Replicated Data Types (CRDT) - 用于
  2. RAFT consensus algorithm - 在分布式网络中选择交易领导者以帮助达成共识。

我的问题是:CRDT 和 RAFT 协议(protocol)之间是否存在关系 - 或者它们是正交的?

最佳答案

在分布式系统术语中,两者有很大不同,并且服务于非常不同的用例。虽然两者的目标都是实现强一致性,但 CRDT 通常不会牺牲可用性,而 Raft 则以牺牲可用性为代价。面对网络分区,CRDT 将保持可用,但 Raft 集群可能会部分或完全不可用。 Raft 是一种共识算法,依赖于集群中的大多数成员相互通信来取得进展。

每个可以管理的状态类型也存在差异。 CRDT 的作用是表示一组有限且定义明确的数据类型,而 Raft 和其他共识算法可用于对更广泛的潜在数据结构和算法进行建模。 Raft 通常用于对复制状态机进行建模。对状态机的命令通过 Raft 算法进行记录和复制,并应用于状态机。状态机可用于对映射和集合等数据结构进行建模,或通过对锁、领导者选举和信号量等建模来控制并发性。

您还必须从可扩展性方面考虑您的系统,Raft 和 CRTD 在这方面也存在显着差异。 Raft 是一个基于领导者的系统。 Raft 选择单个节点作为领导者,Raft 复制状态机的所有状态更改都会经过该单个领导者,并在应用到状态机之前同步复制到大多数追随者。另外,CRDT 的可扩展性显着提高,因为它们不受单个节点的限制。

最终,Raft 和 CRDT 之间的区别在于一致性和性能之间的区别。 Raft 旨在创建单个系统的一致 View ,重点关注安全性而非性能。通常,像 Raft 这样的共识算法用于配置管理和服务发现等。 CRDT 的设计目标是在不牺牲可用性的情况下尽可能快速且一致。通常,CRDT 用于在更依赖可用性且不太关键的系统中进行存储。

关于distributed-computing - CRDT 和 RAFT 协议(protocol)之间是否存在关系——或者它们是正交的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34434011/

相关文章:

java - "Adopting MapReduce model"= 可扩展性的通用答案吗?

python - Python 中的 ZMQ - PULL 端进程能否知道 PUSH 端进程是否已关闭?

stream - 如何从count-min-sketch中获取前K个元素?

c++ - ZeroMQ 并发发布和订阅

distributed-computing - 如果我向 CockroachDB 集群添加一个新节点,该节点的存储空间比现有节点多,会发生什么?

kubernetes - 即使 ETCD 使用 CP 算法 Raft,它如何成为一个高可用系统?

python-3.x - pytorch的并行方式和分布式方式是如何工作的?

node.js - 在学校项目 "Distributed calculation"上计算什么? (有用)

elasticsearch - Elasticsearch :动态添加节点到集群

raft:关于只读查询的一些问题