分布式事务-学习笔记
1.概述
1.1 什么是事务
什么是事务?举个生活中的例子:你去商店买东西就是一个事务的例子,买东西是一个交易,包含“一 手交钱,一手交货”两个动作,交钱和交货这两个动作必须全部成功,交易才算成功,其中任何一个动 作失败,交易就必须撤销。 明白上述例子,再来看事务的定义: 事务可以看做是一次大的活动,它由不同的小活动组成,这些小活动要么全部成功,要么全部失败。
1.2 本地事务
在软件系统中,通常由关系型数据库来控制事务,这是利用数据库本身的事务特性来实现的,因此叫数 据库事务,由于应用主要靠关系数据库来控制事务,而数据库通常和应用在同一个服务器,所以基于关 系型数据库的事务又被称为本地事务。
回顾一下数据库事务的四大特性 ACID:
A(Atomic):原子性,构成事务的所有操作,要么都执行成功,要么全部不执行,不可能出现部分成 功部分失败的情况。
C(Consistency):一致性,在事务执行前后,数据库的一致性约束没有被破坏。比如:张三向李四 转100元,转账前和转账后的数据是正确状态这叫一致性,如果出现张三转出100元,李四账户没有增 加100元这就出现了数据错误,就没有达到一致性。
I(Isolation):隔离性,数据库中的事务一般都是并发的,隔离性是指并发的两个事务的执行互不干 扰,一个事务不能看到其他事务运行过程的中间状态。通过配置事务隔离级别可以避脏读、重复读等问 题。
D(Durability):持久性,事务完成之后,该事务对数据的更改会被持久化到数据库,且不会被回 滚。
数据库事务在实现时会将一次事务涉及的所有操作全部纳入到一个不可分割的执行单元,该执行单元中 的所有操作要么都成功,要么都失败,只要其中任一操作执行失败,都将导致整个事务的回滚。
1.3 分布式事务
随着互联网的快速发展,软件系统由原来的单体应用转变为分布式应用,下图描述了单体应用向分布式 微服务应用的演变:
分布式系统会把一个应用系统拆分为可独立部署的多个服务,因此需要服务与服务之间远程协作才能完 成事务操作,这种分布式系统环境下的事务机制称之为分布式事务。 我们知道本地事务依赖数据库本身提供的事务特性来实现,因此以下逻辑可行:
begin transaction; -- 1.本地数据库操作:张三减少金额 -- 2.本地数据库操作:李四增加金额 commit transaction;
但是在分布式环境下,可能会变成这样:
begin transaction; -- 1.A微服务操作本地数据库:张三减少金额 -- 2.A微服务远程调用B微服务:让李四增加金额 commit transaction;
因此在分布式架构的基础上,传统数据库事务就无法使用了,比如上例,张三和李四的账户不在一个数 据库中甚至不在一个应用系统里,怎么实现转账事务?也就是说同样一个功能,原来是由一个系统完成 的,即使这个功能包含很多个操作,也可以采用数据库事务(本地事务)搞定,而现在这个功能中包含的 多个操作可能是由多个系统(微服务)参与完成的,此时数据库事务(本地事务)就无能为力了,这就需要新 的分布式事务理论来支撑了。
2.分布式事务基础理论
2.1 CAP理论
2.1.1 理解CAP
CAP是 Consistency、Availiability、Partition tolerance三个词语的缩写,分别表示一致性、可用性、 分区容忍性。为了方便对CAP理论的理解,我们结合电商平台中的一些业务场景来理解CAP。
业务背景:
- 我们知道每台数据库服务器有他的最大连接数、负载和吞吐量,若有一天无法再满足我们的业务需 求,就需要横向去扩展几台 Slave(从数据库) 去分担 Master(主数据库) 的压力。
- 如果服务对数据库的需求是 IO 密集型的,那可能会经常遇到增删改影响到了查询效率。这就需要 进行读写分离,由主数据库应付增删改操作,由从数据库应付查询操作,主从数据库的数据要进行 同步。
执行流程: 1、商品服务请求主数据库写入商品信息(添加商品、修改商品、删除商品)
2、主数据库向商品服务响应写入成功。
3、商品服务请求从数据库读取商品信息。
C - Consistency:
一致性是指写操作后的读操作可以读取到最新的数据状态,当数据分布在多个节点上,从任意节点读取 到的数据都是最新的状态。
上图中,商品信息的读写要满足一致性就是要实现如下目标:
1、商品服务写入主数据库成功,则向从数据库查询新数据也成功。
2、商品服务写入主数据库失败,则向从数据库查询新数据也失败。
A - Availability :
可用性是指任何事务操作都可以得到响应结果,且不会出现响应超时或响应错误。
上图中,商品信息读取满足可用性就是要实现如下目标:
1、从数据库接收到数据查询的请求则立即能够响应数据查询结果。
2、从数据库不允许出现响应超时或响应错误。 为了保证可用性,一般需要通过增加从数据库节点来实现。
P - Partition tolerance :
通常分布式系统的各个节点部署在不同的子网,这就是网络分区,不可避免的会出现由于网络故障而导 致节点之间通信失败。分布式系统在遇到某节点或网络分区故障的时候,仍然能够对外提供满足一致性 和可用性的服务,这就是分区容忍性。分布式系统中有某一个或者几个机器宕掉了,其他剩下的机器还 能够正常运转满足系统需求,或者是机器之间有网络异常,将分布式系统分隔未独立的几个部分,各个 部分还能维持分布式系统的运作,这样就具有较好的分区容忍性。
上图中,商品信息读写满足分区容忍性就是要实现如下目标:
1、主数据库向从数据库同步数据失败不影响读写操作。
2、其中一个节点挂掉不影响另一个节点对外提供服务。
2.1.2 CAP组合方式
1、上边的例子是否同时具备CAP呢?
在所有分布式事务场景中不会同时具备CAP三个特性,因为在具备了P的前提下C和A是不能共存的。
在保证分区容忍性的前提下,一致性和可用性无法兼顾,如果要提高系统的可用性就要增加多个节点, 如果要保证数据的一致性就要实现每个节点的数据一致,节点越多可用性越好,但是数据一致性会越 差。
2、CAP有哪些组合方式呢?
1)AP:
放弃一致性,追求分区容忍性和可用性。这是很多分布式系统设计时的选择。
例如:上边的商品管理,完全可以实现AP,前提是只要用户可以接受所查询的到数据在一定时间内不是 最新的即可。通常实现AP都会保证最终一致性,后面讲的BASE理论就是根据AP来扩展的,一些业务场 景 比如:订单退款,今日退款成功,明日账户到账,只要用户可以接受在一定时间内到账即可。
2)CP:
放弃可用性,追求一致性和分区容错性,我们的zookeeper其实就是追求的强一致,又比如跨行转账, 一次转账请求要等待双方银行系统都完成整个事务才算完成。
3)CA:
放弃分区容忍性,即不进行分区,不考虑由于网络不通或节点挂掉的问题,则可以实现一致性和可用 性。那么系统将不是一个标准的分布式系统,我们最常用的关系型数据库就满足了CA。
上边的商品管理,如果要实现CA,则架构如下:
2.1.3 总结
通过上面我们已经学习了CAP理论的相关知识,CAP是一个已经被证实的理论:一个分布式系统最多只 能同时满足一致性(Consistency)、可用性(Availability)和分区容忍性(Partition tolerance)这三 项中的两项。它可以作为我们进行架构设计、技术选型的考量标准。对于多数大型互联网应用的场景, 节点众多、部署分散,而且现在的集群规模越来越大,所以节点故障、网络故障是常态,而且要保证服 务可用性达到N个9(99.99..%),并要达到良好的响应性能来提高用户体验,因此一般都会做出如下选 择:保证P和A,舍弃C强一致,保证最终一致性。
2.2 BASE理论
1、理解强一致性和最终一致性 CAP理论告诉我们一个分布式系统最多只能同时满足一致性(Consistency)、可用性(Availability) 和分区容忍性(Partition tolerance)这三项中的两项,其中AP在实际应用中较多,AP即舍弃一致性, 保证可用性和分区容忍性,但是在实际生产中很多场景都要实现一致性,比如前边我们举的例子,主数 据库向从数据库同步数据,即使不要一致性,但是最终也要将数据同步成功来保证数据一致,这种一致 性和CAP中的一致性不同,CAP中的一致性要求在任何时间查询每个节点数据都必须一致,它强调的是 强一致性,但是最终一致性是允许可以在一段时间内每个节点的数据不一致,但是经过一段时间每个节 点的数据必须一致,它强调的是最终数据的一致性。
2、Base理论简介 BASE 是 Basically Available(基本可用)、Soft state(软状态)和 Eventually consistent (最终一致性)三个 短语的缩写。BASE理论是对CAP中AP的一个扩展,通过牺牲强一致性来获得可用性,当出现故障允许 部分不可用但要保证核心功能可用,允许数据在一段时间内是不一致的,但最终达到一致状态。满足 BASE理论的事务,我们称之为“柔性事务”。
- 基本可用 : 分布式系统在出现故障时,允许损失部分可用功能,保证核心功能可用。如,电商网站 交易付款出现问题了,商品依然可以正常浏览。
- 软状态 : 由于不要求强一致性,所以BASE允许系统中存在中间状态(也叫软状态),这个状态不 影响系统可用性,如订单的"支付中"、“数据同步中”等状态,待数据最终一致后状态改为“成功”状 态。
- 最终一致 : 最终一致是指经过一段时间后,所有节点数据都将会达到一致。如订单的"支付中"状 态,最终会变为“支付成功”或者"支付失败",使订单状态与实际交易结果达成一致,但需要一定时 间的延迟、等待。
本文作者:KwFruit
本文链接:https://www.cnblogs.com/mangoubiubiu/p/15626488.html
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)