Aurora Multi-Master 解读

1.Aurora官方资料

1.1 分布式锁管理(未采用)

优点:

数据对于所有节点可用
容易搭建上层应用
类似于多处理器中的缓存一致性

缺点:

基于每个锁，加重缓存一致性通信
网络代价昂贵
当热点块产生会有负影响

Alt text

1.2 2PC或Paxos实现一致性(未采用)

优点:

Query可以分解并发送到数据节点
对于提交，更少一致性通信(在事务提交时才进行冲突检测和解决)
能够扩展到多个节点

缺点：

加重提交和成员改变协议
Range分区会导致热点分区产生，而不只是热点块。重新分区代价高昂。
跨分区操作代价高，更适合小的请求。
1.3 使用分布式ledgers解决冲突

Aurora有很多一致性的”绿洲”
数据库节点(CE)可以从那个节点获知事务的顺序。
存储节点(SE)可以从那个节点获知事务应用顺序。
只有当数据在多个数据库节点和多个存储节点同时改变存在冲突
不需要大的协调。
1.4 分层解决冲突
两个主节点同时写入Page 1和Page 2
蓝色主节点在P1 赢下仲裁，橙色主节点在P2赢下仲裁
两个节点意识到冲突并开始两种选择：回滚这个事务 或 向上层提交给区域仲裁
仲裁人决定谁赢得这次仲裁。
1.5 多主机的崩溃恢复
1.6 多区域多主机
本地接收写
乐观并发控制——没有分布式锁管理，没有繁琐的锁管理协议
在头结点，存储节点，在AZ和region级别实现仲裁制度
如果没有或者只有低等级冲突可以保证接近线性扩展的性能。
2.行业解读
2.1 解读一
每个master维护自己的lsn

从全局看，每个参与多写的计算节点(主CE)都有逻辑的Master。每个计算节点维护自己的LSN，CPL和VCL。如果一个计算节点挂掉重启，那他只恢复自己的CPL并rollback自己(Version > CPL)的redolog。
到每个segment上，写到每个segment的每条redo MTR记录，ID为 [计算节点ID，计算节点private LSN] 的Pair。
2.1 解读二
分布式Log
distributed log一般用的是类似于经典的Quorum consensus算法，就是2W>N && W+R>N，但是有细微的改动，也有很优越的好处：strip。

2.3 解读三

当这个Master crash的时候，新的Master是不是需要从distributed ledger找到旧Master的VDL，进而trucate掉该系列LSN中大于VDL的redo？下面是ppt的其中一页：
多个Master之间的冲突检测和解决是比较简单的，也是得益于distributed ledger。只要Master的redo log带上page修改前的version，distributed ledger做一个CAS就能发现冲突了。那发现冲突后怎么解决呢？比如T1和T2两个事务冲突了，最简单的做法就是一起回滚，但是Aurora实现了仲裁者，可以由仲裁者来觉得谁回滚，具体实现就不清楚。

Aurora Multi-Master 解读

Aurora Multi-Master 解读

Aurora Multi-Master 解读

1.Aurora官方资料

1.1 分布式锁管理(未采用)

1.2 2PC或Paxos实现一致性(未采用)

1.3 使用分布式ledgers解决冲突

1.4 分层解决冲突

1.5 多主机的崩溃恢复

1.6 多区域多主机

2.行业解读

2.1 解读一

2.1 解读二

分布式Log

2.3 解读三