分布式事务基础

事务

指的就是一个操作单元,在这个操作单元中的所有操作最终要保持一致的行为,要么所有操作都成功,要么所有的操作都被撤销。

事务的4个特性

  • 原子性:操作这些指令时,要么全部执行成功,要么全部不执行。只要其中一个指令执行失败,所有的指令都执行失败,数据进行回滚,回到执行指令前的数据状态。

  • 一致性:事务的执行使数据从一个状态转换为另一个状态,数据库的完整性约束没有被破坏。拿转账来说,假设用户A和用户B两者的钱加起来一共是2000,那么不管A和B之间如何转账,转几次账,事务结束后两个用户的钱相加起来应该还得是2000,这就是事务的一致性。

  • 隔离性:数据库中的事务一般都是并发的,隔离性是指并发的两个事务的执行互不干扰,一个事务不能看到其他事务运行过程的中间状态。通过配置事务隔离级别可以避免赃读、不可重复读问题

  • 持久性:事务完成之后,该事务对数据的更改会被持久化到数据库,且不会被回滚。

分布式事务

分布式系统会把一个应用系统拆分成可独立部署的多个服务,服务与服务之间需要远程协作才能完成事务操作,这种分布式系统环境下由不同的服务之间通过网络远程协作完成事务称作分布式事务。例如:

begin transaction
    //1.A系统 张三减少金额
    //2.远程调用B系统 李四增加金额
commit transaction

假如张三向李四转账,当远程调用让李四增加金额成功了,由于网络问题远程调用并没有返回,此时本地事务提交失败就回滚了张三减少金额的操作,此时张三和李四的数据就不一致了。 因此在分布式架构的基础上,传统数据库事务就无法使用了,张三和李四的账户不

在一个数据库中甚至不在一个应用系统里,实现转账事务需要通过远程调用,由于网络问题就会导致分布式事务问题。

分布式事务产生场景

  • 1、跨JVM进程产生分布式事务。典型的场景就是微服务架构,微服务之间通过远程调用完成事务操作。 比如:订单微服务和库存微服务,下单的同时订单微服务请求库存微服务减库存。

  • 2、跨数据库实例。单体系统访问多个数据库实例。当单体系统需要访问多个数据库(实例)时就会产生分布式事务。 比如:用户信息和订单信息分别在两个MySQL实例存储,用户管理系统删除用户信息,需要分别删除用户信息及用户的订单信息,由于数据分布在不同的数据实例,需要通过不同的数据库连接去操作数据,此时产生分布式事务。

分布式事务基础理论

分布式系统各个服务之间通过网络交互,不能因为有一点网络问题就导致整个系统无法提供服务,网络因素成为了分布式事务的考量标准之一。因此,分布式事务需要更进一步的理论支持,接下来,我们先来学习一下分布式事务的CAP理论。

CAP理论

CAP原则又叫CAP定理,指的是在一个分布式系统中,不可能同时满足以下三点。

下图是商品信息管理的执行流程:

整体执行流程如下:

  • 商品服务请求主数据库写入商品信息(添加商品、修改商品、删除商品)

  • 主数据库向商品服务响应写入成功

  • 商品服务请求从数据库读取商品信息

  1. C-Consistency(一致性):一致性是指写操作后的读操作可以读取到最新的数据状态,当数据分布在多个节点上,从任意节点读取到的数据都是最新的状态。

上图中如果满足一致性就得商品服务写入主数据库成功,则可以向从数据库查询到最新数据。如何才能做到呢?在插入主数据库后,再把数据同步到从数据库,同步期间从数据库不对外提供访问(资源锁定)。

  1. A-Availability(可用性):可用性是指每次向服务发送请求,总能得到响应数据(允许不是最新数据),且不会出现响应超时或响应错误。

上图中如果满足可用性就得从数据库接收到请求则立即能够响应数据查询结果,而不用管数据是新还是旧。如何才能做到呢?在插入主数据库后,再把数据同步到从数据库,同步期间从数据库也需要能够正常访问。

  1. P-Partition tolerance(分区容忍性):通常分布式系统的各个节点部署在不同的子网,这就是网络分区,不可避免的会出现由于网络问题而导致节点之间通信失败,此时仍可对外提供服务,这叫分区容忍性。分区容错性是分布式系统具备的基本能力。

上图中如果满足分区容忍性就得商品服务写入主数据库成功,从数据库即使同步失败,也能对外提供访问。如何才能做到呢?

  • 尽量使用异步取代同步操作(如果是同步,网络不通必定导致发生异常,也就导致了该功能不可用,比如订单系统调用库存系统,网络不通,必定导致库存无法扣减,那么下单功能就无法使用。使用异步,则可以先下单,库存扣减放到消息队列,后面再来扣减等方式)

  • 添加从数据库节点,其中一个从节点挂掉其他从节点仍能提供服务(添加从节点,就算网络和其中一台不通,但是还可以调用其他的服务,所以功能也能正常使用)

CAP组合方式

在所有分布式事务场景中,不会同时具备CAP三个特性,因为在具备了P的前提下C和A是不能共存的。为什么呢?一致性要求数据同步期间需要对资源进行锁定,锁定了就无法对外提供服务,而可用性又要求在同步期间仍能对外提供访问。所以矛盾。

  • AP:放弃一致性,追求分区容忍性和可用性,查询时可能会查到旧数据(也就是不一致),但是可以接受。一旦同步完成,数据就是最新的了。通常实现AP都会保证最终一致性,后面讲的BASE理论就是根据AP来扩展的,一些业务场景比如订单退款,今日退款成功,明日账户到账,只要用户可以接受在一定时间内到账即可。

  • CP:放弃可用性,追求一致性和分区容错性,比如zookeeper就是追求的强一致性,又比如跨行转账,一次转账请求要等待双方银行系统都完成整个事务才算完成。

  • CA:放弃分区容忍性,即不进行分区,不考虑由于网络不通或节点挂掉的问题,其实就不是一个标准的分布式系统。关系型数据库满足了CA。

BASE理论

BASE是Basucally Available(基本可用)、Soft state(软状态)、Eventually consistent(最终一致性)三个短语的缩写。BASE理论是对CAP中AP的一个扩展,通过牺牲强一致性来获得可用性,当出现故障允许部分不可用但要保证核心功能可用,允许

数据在一段时间内是不一致的,但最终达到一致状态。满足BASE理论的事务,称为柔性事务。

  • 基本可用:当分布式系统出现故障时,允许部分不可用但要保证核心功能可用(比如为了保证系统可以,对服务采取降级处理)

  • 软状态:由于不要求强一致性,所以BASE允许系统中存在中间状态(也叫软状态),这个状态不影响系统可用性,比如订单的“支付中”

  • 最终一致:最终一致是指经过一段时间过后,所有节点数据都将达到一致,如订单的“支付中”最终都会变为“支付成功或失败”

参考来源:
AlibabaCloud框架之Seata分布式事务
微服务架构的分布式事务控制解决方案

posted @ 2021-03-12 12:44  ~冰  阅读(80)  评论(0编辑  收藏  举报