前言
在分布式的微服务架构中,鉴于服务单一职责性,各个微服务都分布在不同的服务器节点,且每1个微服务是独立的;
在后端每个微服务都是分散和独立的,可能使用不同编程语言,使用不同的数据库,通过RPC调用完成前端用户发送的请求(任务);
假设1个用户在1个分布式微服务架构的电商网站购物,购买了1件商品点击了下单,后台需要一组微服务协作完成下单操作;
即:订单服务创建订单--->库存服务减少库存---->用户服务减少余额;
在这3个环节执行过程中,如果其中1个微服务不可用,都无法满足当前用户下单的需求;
那如何保证用户的1次操作具备数据库事务的ACID特性呢?
这就需要分布式事务;
一、CAP理论
2000年加州理工大学伯克利分校的EricBrewer教授提出在分布式架构中应当具备3个理想的指标
- Consistency(一致性)
- Availability(可用性)
在分布式系统中,C、A、P三个指标无法同时全部满足;
在分布式系统中,数据在主从节点同步时会出现网络分区、节点故障等不可控因素,因此 C和A是相互矛盾的,无法在保证数据一致性的同时也保证数据的可用性,只能2者选其一;
例如:
- Zookeeper: CP,leader选举过程中服务端不可用;
- Eureka: AP
- Nacos : 默认AP可选择为CP
指分布式架构中,客户端一定是可以读取到数据的,保证数据的可用性;
但有可能客户端在向服务端读取数据时,分布式服务端中的主、从节点正在同步数据,所以无法保证数据在分布式架构中的一致性;
3.分区容错
在分布式微架构中,如果想要实现一致性就需要在2个节点之间通过网络同步数据;
假设G1和G2两个节点要想实现数据一致性,就需要通过网络传输同步数据,但网络传输数据是需要时间的;
忠和孝无法两全,如果G1更新了数据,在G1和G2节点通过网络传输同步数据的这1段时间里,G2节点是对外提供查询服务呢?还是不提供服务呢?
- G2提供服务就不满足一致性指标;
- G2阻塞用户请求,不提供服务就无法满足100%可用性指标;
以上是CAP理论存在的问题;
2.BASE理论
BASE理论是针对CAP理论存问题的1种解决方案,包含3个思想:
2.1.Basically Available (基本可用)
分布式系统在出现故障时,允许损失部分可用性,即保证核心可用。
2.2.Soft State(软状态)
在一定时间内,允许出现中间状态,比如临时的不一致状态。
2.3.Eventually Consistent(最终一致性)
-
AP模式:各子事务分别执行和提交,允许出现结果不一致,然后采用弥补措施恢复数据即可,实现最终一致。
-
官网地址:http://seata.io/
-
TC (Transaction Coordinator) - 事务协调者:搭建好的Seata服务器,所有的RM和TM都要想TC上报,当前分支事务执行的状态,以便于TC作出全局事务的回滚/提交操作(CEO);
-
TM (Transaction Manager) - 事务管理器:代表整个业务逻辑,决定全局事务的范围和边界,从哪个环节开始全局事务?在哪个环节提交或回滚全局事务?从哪个环节结束全局事务?(经理)
-
RM (Resource Manager) - 资源管理器:具体执行分支事务的微服务
-
XA模式:强一致性分阶段事务模式,牺牲了一定的可用性,无业务侵入
-
TCC模式:最终一致的分阶段事务模式,有业务侵入
-
AT模式:最终一致的分阶段事务模式,无业务侵入,也是Seata的默认模式
-
SAGA模式:长事务模式,有业务侵入
2.安装Seata
2.1.Seata配置文件
使Seata服务注册到Nacos中,并指定读取Nacos中的配置文件;
registry { # tc服务的注册中心类,这里选择nacos,也可以是eureka、zookeeper等 type = "nacos" nacos { # seata tc 服务注册到 nacos的服务名称,可以自定义 application = "seata-tc-server" serverAddr = "127.0.0.1:8848" group = "DEFAULT_GROUP" namespace = "" cluster = "SH" username = "nacos" password = "nacos" } } config { # 读取tc服务端的配置文件的方式,这里是从nacos配置中心读取,这样如果tc是集群,可以共享配置 type = "nacos" # 配置nacos地址等信息 nacos { serverAddr = "127.0.0.1:8848" namespace = "" group = "DEFAULT_GROUP" username = "nacos" password = "nacos" dataId = "seataServer.properties" } }
2.2.
配置内容如下
registry { # tc服务的注册中心类,这里选择nacos,也可以是eureka、zookeeper等 type = "nacos" nacos { # seata tc 服务注册到 nacos的服务名称,可以自定义 application = "seata-tc-server" serverAddr = "127.0.0.1:8848" group = "DEFAULT_GROUP" namespace = "" cluster = "SH" username = "nacos" password = "nacos" } } config { # 读取tc服务端的配置文件的方式,这里是从nacos配置中心读取,这样如果tc是集群,可以共享配置 type = "nacos" # 配置nacos地址等信息 nacos { serverAddr = "127.0.0.1:8848" namespace = "" group = "DEFAULT_GROUP" username = "nacos" password = "nacos" dataId = "seataServer.properties" } }
TC服务在管理分布式事务时,需要记录事务相关数据到数据库中,你需要提前创建好这些表。
这些表主要记录全局事务、分支事务、全局锁信息:
SET NAMES utf8mb4; SET FOREIGN_KEY_CHECKS = 0; -- ---------------------------- -- 分支事务表 -- ---------------------------- DROP TABLE IF EXISTS `branch_table`; CREATE TABLE `branch_table` ( `branch_id` bigint(20) NOT NULL, `xid` varchar(128) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL, `transaction_id` bigint(20) NULL DEFAULT NULL, `resource_group_id` varchar(32) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL, `resource_id` varchar(256) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL, `branch_type` varchar(8) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL, `status` tinyint(4) NULL DEFAULT NULL, `client_id` varchar(64) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL, `application_data` varchar(2000) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL, `gmt_create` datetime(6) NULL DEFAULT NULL, `gmt_modified` datetime(6) NULL DEFAULT NULL, PRIMARY KEY (`branch_id`) USING BTREE, INDEX `idx_xid`(`xid`) USING BTREE ) ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Compact; -- ---------------------------- -- 全局事务表 -- ---------------------------- DROP TABLE IF EXISTS `global_table`; CREATE TABLE `global_table` ( `xid` varchar(128) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL, `transaction_id` bigint(20) NULL DEFAULT NULL, `status` tinyint(4) NOT NULL, `application_id` varchar(32) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL, `transaction_service_group` varchar(32) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL, `transaction_name` varchar(128) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL, `timeout` int(11) NULL DEFAULT NULL, `begin_time` bigint(20) NULL DEFAULT NULL, `application_data` varchar(2000) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL, `gmt_create` datetime NULL DEFAULT NULL, `gmt_modified` datetime NULL DEFAULT NULL, PRIMARY KEY (`xid`) USING BTREE, INDEX `idx_gmt_modified_status`(`gmt_modified`, `status`) USING BTREE, INDEX `idx_transaction_id`(`transaction_id`) USING BTREE ) ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Compact; SET FOREIGN_KEY_CHECKS = 1;
2.4.
<!--seata--> <dependency> <groupId>com.alibaba.cloud</groupId> <artifactId>spring-cloud-starter-alibaba-seata</artifactId> <exclusions> <!--版本较低,1.3.0,因此排除--> <exclusion> <artifactId>seata-spring-boot-starter</artifactId> <groupId>io.seata</groupId> </exclusion> </exclusions> </dependency> <dependency> <groupId>io.seata</groupId> <artifactId>seata-spring-boot-starter</artifactId> <!--seata starter 采用1.4.2版本--> <version>${seata.version}</version> </dependency>
seata:
registry: # TC服务注册中心的配置,微服务根据这些信息去注册中心获取tc服务地址
type: nacos # 注册中心类型 nacos
nacos:
server-addr: 127.0.0.1:8848 # nacos地址
namespace: "" # namespace,默认为空
group: DEFAULT_GROUP # 分组,默认是DEFAULT_GROUP
application: seata-tc-server # seata服务名称
username: nacos
password: nacos
tx-service-group: seata-demo # 事务组名称
service:
vgroup-mapping: # 事务组与cluster的映射关系
seata-demo: SH
六、Seata的事务模式
Seata提供4种事务模式,帮我们实现分布式事务;
异常情况:
-
事务协调者通知每个事物参与者,去数据库执行事务的预提交;
-
事务参与者预提交完成之后,向事务协调者报告事务预提交状态;(此时事务不是真正的提交,继续持有数据库锁)
二阶段:
-
事务协调者基于一阶段的报告来判断下一步操作
-
如果一阶段的分支事务全部预提交成功,则通知所有事务参与者去数据库正真提交事务
-
如果一阶1个事务参与者的预提交结果失败,则通知所有事务参与者回滚事务
-
① 注册分支事务到TC
② 执行分支业务sql但不提交
③ 报告执行状态到TC
TC二阶段的工作:
-
TC检测各分支事务执行状态
a.如果都成功,通知所有RM提交事务
b.如果有失败,通知所有RM回滚事务
RM二阶段的工作:
-
接收TC指令,提交或回滚事务
XA模式的优点是什么?
-
事务的强一致性,满足ACID原则。
-
常用数据库都支持,实现简单,并且没有代码侵入
XA模式的缺点是什么?
-
因为一阶段需要锁定数据库资源,等待二阶段结束才释放,性能较差
-
依赖关系型数据库实现事务
seata:
data-source-proxy-mode: XA
2.4.2.添加注解
给发起全局事务的入口方法添加@GlobalTransactional注解
@Override @Transactional //给发起全局事务的入口方法添加@GlobalTransactional注解: @GlobalTransactional public Long create(Order order) { // 创建订单 orderMapper.insert(order); try { // 扣用户余额 accountClient.deduct(order.getUserId(), order.getMoney()); // 扣库存 storageClient.deduct(order.getCommodityCode(), order.getCount()); } catch (FeignException e) { log.error("下单失败,原因:{}", e.contentUTF8(), e); throw new RuntimeException(e.contentUTF8(), e); } return order.getId(); }
2.4.3.
-
注册分支事务
-
记录undo-log(数据快照以保证事务提交失败之后可以回滚)
-
执行业务sql并提交
-
报告事务状态
阶段二提交时RM的工作:
-
删除undo-log即可
阶段二回滚时RM的工作:
-
根据undo-log恢复数据到更新前
简述AT模式与XA模式最大的区别是什么?
-
XA模式一阶段不提交事务,锁定资源;AT模式一阶段直接提交,不锁定资源。
-
XA模式依赖数据库机制实现回滚;AT模式利用数据快照实现数据回滚。
-
3.2.脏写问题
在多线程并发访问AT模式的分布式事务时,有可能出现脏写问题,如图:
解决脏写问题的思路就是引入了全局锁的概念。
在释放DB锁之前,先拿到全局锁。避免同一时刻有另外一个事务来操作当前数据。
3.3.
-
一阶段完成直接提交事务,释放数据库资源,性能比较好
-
利用全局锁实现读写隔离
-
没有代码侵入,框架自动完成回滚和提交
AT模式的缺点:
-
两阶段之间属于软状态,属于最终一致
-
框架的快照功能会影响性能,但比XA模式要好很多
3.4.
CREATE TABLE `lock_table` ( `row_key` varchar(128) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL, `xid` varchar(96) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL, `transaction_id` bigint(20) NULL DEFAULT NULL, `branch_id` bigint(20) NOT NULL, `resource_id` varchar(256) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL, `table_name` varchar(32) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL, `pk` varchar(36) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL, `gmt_create` datetime NULL DEFAULT NULL, `gmt_modified` datetime NULL DEFAULT NULL, PRIMARY KEY (`row_key`) USING BTREE, INDEX `idx_branch_id`(`branch_id`) USING BTREE ) ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Compact;
------------------------------------------
DROP TABLE IF EXISTS `undo_log`; CREATE TABLE `undo_log` ( `branch_id` bigint(20) NOT NULL COMMENT 'branch transaction id', `xid` varchar(100) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL COMMENT 'global transaction id', `context` varchar(128) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL COMMENT 'undo_log context,such as serialization', `rollback_info` longblob NOT NULL COMMENT 'rollback info', `log_status` int(11) NOT NULL COMMENT '0:normal status,1:defense status', `log_created` datetime(6) NOT NULL COMMENT 'create datetime', `log_modified` datetime(6) NOT NULL COMMENT 'modify datetime', UNIQUE INDEX `ux_undo_log`(`xid`, `branch_id`) USING BTREE ) ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci COMMENT = 'AT transaction mode undo table' ROW_FORMAT = Compact;
seata:
data-source-proxy-mode: AT # 默认就是AT
2.4.3.重启服务并测试
-
Try:资源的检测和预留;
-
Confirm:完成资源操作业务;要求 Try 成功 Confirm 一定要能成功。
-
Cancel:预留资源释放,可以理解为try的反向操作。
TCC模式的出现的空回归和业务悬挂问题都是因为TM(全局事务管理器)会通过单独的线程异步调用Try、Cancel、Confirm这3个操作;
且会出现重复调用现象,所以TCC模式中的Try、Cancel、Confirm这3个操作都需要实现幂等性、并且避免空回归和业务悬挂;
1.TCC执行流程
- TM(业务逻辑方法)开始执行之后,立即自动向TC(Seat服务器)开启1个发起全局事务的通知;
- TC为当前全局事务分配1个全局事务编号;
- TM(业务逻辑方法)方法依次向下调用TM业务逻辑方法里包含的RM分支事务,RM向TC上报分支事务的执行状态,TC为RM分配分支事务编号;
- TM业务逻辑方法调用完了所有RM之后,TM向TC上报执行成功/失败通知,TC向所有RM下达分支事务的Commit/Rollback操作;
2.
在未执行第1阶段的Try操作时,先执行了第二阶段的Cancel回滚操作,说白了就是还没有执行Try操作就执行了Cancel回滚操作,就是空回滚
事务悬挂是针对Try操作的;
想要实现TCC模式就需要选择好业务逻辑在哪里?也就是在哪里实现1个TM;
CREATE TABLE `account_freeze_tbl` ( `xid` varchar(128) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL, `user_id` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL, `freeze_money` int(11) UNSIGNED NULL DEFAULT 0, `state` int(1) NULL DEFAULT NULL COMMENT '事务状态,0:try,1:confirm,2:cancel', PRIMARY KEY (`xid`) USING BTREE ) ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = COMPACT;
- freeze_money:用来记录用户冻结金额
package cn.itcast.account.service; import io.seata.rm.tcc.api.BusinessActionContext; import io.seata.rm.tcc.api.BusinessActionContextParameter; import io.seata.rm.tcc.api.LocalTCC; import io.seata.rm.tcc.api.TwoPhaseBusinessAction; @LocalTCC public interface AccountService { /** * 从用户账户中扣款 */ //void deduct(String userId, int money); //修改以上代码为以下内容 @TwoPhaseBusinessAction(name = "deduct", commitMethod = "confirm", rollbackMethod = "cancel") void deduct(@BusinessActionContextParameter(paramName = "userId") String userId, @BusinessActionContextParameter(paramName = "money")int money); boolean confirm(BusinessActionContext ctx); boolean cancel(BusinessActionContext ctx); }
package cn.itcast.account.service.impl; import cn.itcast.account.entity.AccountFreeze; import cn.itcast.account.mapper.AccountFreezeMapper; import cn.itcast.account.mapper.AccountMapper; import cn.itcast.account.service.AccountService; import io.seata.core.context.RootContext; import io.seata.rm.tcc.api.BusinessActionContext; import lombok.extern.slf4j.Slf4j; import org.springframework.beans.factory.annotation.Autowired; import org.springframework.stereotype.Service; import org.springframework.transaction.annotation.Transactional; /** * @author 张根 */ @Slf4j @Service public class AccountServiceImpl implements AccountService { @Autowired private AccountMapper accountMapper; @Autowired private AccountFreezeMapper freezeMapper; @Override @Transactional //正常逻辑 public void deduct(String userId, int money) { // 0.获取事务id String xid = RootContext.getXID(); // 查询freeze,防止业务悬挂 AccountFreeze oldFreeze = freezeMapper.selectById(xid); if (oldFreeze != null) { // 拒绝业务 return; } // 1.扣减可用余额 accountMapper.deduct(userId, money); // 2.记录冻结金额,事务状态 AccountFreeze freeze = new AccountFreeze(); freeze.setUserId(userId); freeze.setFreezeMoney(money); freeze.setState(AccountFreeze.State.TRY); freeze.setXid(xid); freezeMapper.insert(freeze); } //全体事务没有出现问题 @Override public boolean confirm(BusinessActionContext ctx) { // 1.获取事务id String xid = ctx.getXid(); // 2.根据id删除冻结记录 int count = freezeMapper.deleteById(xid); return count == 1; } //全体事务中其中1个环节出现问题-回滚 @Override @Transactional public boolean cancel(BusinessActionContext ctx) { // 0.查询冻结记录 String xid = ctx.getXid(); String userId = ctx.getActionContext("userId").toString(); AccountFreeze freeze = freezeMapper.selectById(xid); // 空回滚判断 if (freeze == null) { freeze = new AccountFreeze(); freeze.setUserId(userId); freeze.setFreezeMoney(0); freeze.setState(AccountFreeze.State.CANCEL); freeze.setXid(xid); freezeMapper.insert(freeze); return true; } // 幂等判断 if(freeze.getState() == AccountFreeze.State.CANCEL){ // 已经处理过了,无需重复cancel return true; } // 1.恢复可用余额 accountMapper.refund(freeze.getUserId(), freeze.getFreezeMoney()); // 2.将冻结金额清零,状态改为CANCEL freeze.setFreezeMoney(0); freeze.setState(AccountFreeze.State.CANCEL); int count = freezeMapper.updateById(freeze); return count == 1; } }
4.
TCC模式的每个阶段是做什么的?
-
Try:资源检查和预留
-
Confirm:业务执行和提交
-
Cancel:预留资源的释放
TCC的优点是什么?
-
一阶段完成直接提交事务,释放数据库资源,性能好
-
相比AT模型,无需生成快照,无需使用全局锁,性能最强
-
不依赖数据库事务,而是依赖补偿操作,可以用于非事务型数据库
TCC的缺点是什么?
-
有代码侵入,需要人为编写try、Confirm和Cancel接口,太麻烦
-
软状态,事务是最终一致
-
需要考虑Confirm和Cancel的失败情况,做好幂等处理
分布式事务执行过程中,依次执行各参与者的正向操作,如果所有正向操作均执行成功,那么分布式事务提交。如果任何一个正向操作执行失败,那么分布式事务会去退回去执行前面各参与者的逆向回滚操作,回滚已提交的参与者,使分布式事务回到初始状态。
Saga也分为两个阶段:
-
一阶段:直接提交本地事务
-
二阶段:成功则什么都不做;失败则通过编写补偿业务来回滚
优点:
-
事务参与者可以基于事件驱动实现异步调用,吞吐高
-
一阶段直接提交事务,无锁,性能好
-
不用编写TCC中的三个阶段,实现简单
缺点:
-
软状态持续时间不确定,时效性差
-
-
一致性:能否保证事务的一致性?强一致还是最终一致?
-
隔离性:事务之间的隔离性如何?
-
代码侵入:是否需要对业务代码改造?
-
性能:有无性能损耗?
-