Riak的最终一致性实现原理

CAP原理告诉我们,一致性,可用性和分区容忍性三者最多只能偏重其中两个。在NoSQL系统中,分区容忍性(P)几乎已经成为必选项。于是很多NoSQL选择了牺牲一定一致性的做法。比如Amazon的Dynamo,比如本文的主角Riak

下面一介绍的是Riak官方的一篇文章,通过几个典型的故障案例,对Riak的最终一致性原理进行了讲解。

请求过程

首先介绍一下Riak的请求处理过程,以数据冗余N份存储,每次读取其中的R份,写操作需要写W份。

  • 通过计算得出请求的key所在的N个节点
  • 向这N个节点依次发起请求
  • 等待这N个节点中的W个(如果是写操作的)或R个(如果是读操作)返回成功
  • 返回相应的数据给客户端

失败场景

下面讨论几种失败场景:

1.读取数据前其中一个节点故障

  • 数据以W=3成功写入三份
  • 其中一个节点故障
  • 数据再以R=3读取三份,发起三个请求
  • 此次读操作会返回了not_found
  • 而这次系统在检测到了数据只有两份,会启动修复器将数据备份一份到secondary节点上,以保证有三份备份
  • 后续的读操作将会从primary上读到两份,从secondary上读到一份数据,以实现成功读到三份数据。

2.读取数据前其中两个节点故障

  • 数据以W=3成功写入三份
  • 其中两个节点故障
  • 数据再以R=3读取三份,发起三个请求
  • 此次读操作会返回了not_found
  • 后续的读操作将会从primary上读到一份,从secondary上读到两份数据,以实现成功读到三份数据。

3.读取数据前三个节点全部故障

  • 数据以W=3成功写入三份
  • 其中三个节点故障
  • 数据读取操作将会永远返回not_found,直到某个节点恢复

4.写操作前一个节点故障

  • 一个节点故障
  • 数据以W=3发起三个写请求
  • 一个secondary节点承担了其中的一个写请求
  • 后面的读请求会正常的读到三份数据

5.写操作前一个节点故障,后来又恢复了

  • 一个节点故障
  • 数据以W=3发起三个写请求
  • 一个secondary节点承担了其中的一个写请求
  • 故障节点又恢复了
  • 在60秒内,一个叫hinted handoff的过程会启动,将secondary中的数据迁移到刚刚恢复的primary中
  • 在hinted handoff过程完成后,数据就恢复正常了

6.在hinted handoff 过程中进行读写操作

在hinted handoff过程中,由于原来的primary节点是启动的,所以数据读写操作都会到这个节点上来执行,这时候可能由于一些值还没有备份回来,所以会导致这个节点暂时的not_found返回。

7.在两个primary节点故障后一个又恢复期间进行读写操作

这时候刚刚恢复的节点会进行hinted handoff过程,而读写操作依然会由于not_found的发生而启动修复器进行数据备份到secordary中。

原文链接:Eventual Consistency

anyShare赠人玫瑰,手有余香,分享知识,德艺双馨!
          

无觅相关文章插件,快速提升流量