Seata TCC源码分析

Seata是什么

Seata是阿里近期开源的分布式事务框架。框架包括了集团的TXC(云版本叫GTS)和蚂蚁金服的TCC两种模式,短短数月Github上的star数已经接近一万,算是目前唯一有大厂背书的分布式事务解决方案。

TXCSeata中又叫AT模式,意为补偿方法是框架自动生成的,对用户完全屏蔽,用户可以向使用本地事务那样使用分布式事务,缺点是仅支持关系型数据库(目前支持MySQL),引入Seata AT的服务需要本地建表存储rollback_info,隔离级别默认RU适用场景有限。

TCC不算是新概念,很早就有了,用户通过定义try/confirm/cancel三个方法在应用层面模拟两阶段提交,区别在于TCCtry方法也需要操作数据库进行资源锁定,后续两个补偿方法由框架自动调用,分别进行资源提交和回滚,这点同单纯的存储层2PC不太一样。蚂蚁金服向Seata贡献了自己的TCC实现,据说已经演化了十多年,大量应用在在金融、交易、仓储等领域。

分布式事务的诞生背景

早期应用都是单一架构,例如支付服务涉及到的账户、金额、订单系统等都由单一应用负责,底层访问同一个数据库实例,自然事务操作也是本地事务,借助Spring可以轻松实现;但是由于量级越来越大,单一服务需要进行职责拆分变为三个独立的服务,通过RPC进行调用,数据也存在不同的数据库实例中,由于这时一次业务操作涉及对多个数据库数据的修改,无法再依靠本地事务,只能通过分布式事务框架来解决。

img

TCC就是分布式事务的一种解决方案,属于柔性补偿型,优点在于理解简单、仅try阶段加锁并发性能较好,缺点在于代码改造成本。

什么是TCC本文就不再赘述了,TCC的概念本身并不复杂

Seata TCC使用方法

在分析源码之前,我们先简要提及下Seata TCC模式的使用方法,有助于后续理解整个TCC流程。

Seata TCC参与方

Seata中的TCC模式要求TCC服务的参与方在接口上增加@TwoPhaseBusinessAction注解,注明TCC接口的名称(全局唯一),TCC接口的confirmcancel方法的名称,用于后续框架反射调用,下面是一个TCC接口的案例:

public interface TccAction {
    @TwoPhaseBusinessAction(name = "yourTccActionName", commitMethod = "confirm", rollbackMethod = "cancel")
    public boolean try(BusinessActionContext businessActionContext, int a, int b);
    public boolean confirm(BusinessActionContext businessActionContext);
    public boolean cancel(BusinessActionContext businessActionContext);
}

紧接着定义实现类Impl实现这个接口,为三个方法提供具体实现。最后将参与方服务进行发布,注册到远端,主要为了后续能让Seata框架调用到参与方的confirm或者cancel方法闭环整个TCC事务。

Seata TCC发起方

Seata TCC的发起方类似于我们上图中的payment service,参与方需要在业务方法上增加@GlobalTransactional注解,用于开启切面注册全局事务,业务方法中调用TCC参与方的若干try方法,一旦业务方法调用成功,Seata框架会通知TC回调这些参与方的confirmcancel方法。

源码分析

SeataTCC模式的源码并不复杂,主要集中于:

module class 功能
seata-spring GlobalTransactionalInterceptor.class 全局事务切面逻辑,包括注册全局事务,拿到 xid
seata-spring TccActionInterceptor.class TCC 参与方切面逻辑
seata-tcc TCCResourceManager.class 解析 TCC Bean,保存 TCC Resources,便于后续回调
seata-tcc ActionInterceptorHandler.class TCC 分支事务注册实现
seata-server DefaultCoordinator.class、FileTransactionStoreManager.class 主要是 TC 的实现、事务存储等实现

注册TCC Resources

Seata中一个TCC接口被称作一个TCC Resources,其结构如下:

public class TCCResource implements Resource {
 
    private String resourceGroupId = "DEFAULT";
 
    private String appName;
 
    private String actionName; // TCC 接口名称 
 
    private Object targetBean; // TCC Bean
 
    private Method prepareMethod; // try 方法
 
    private String commitMethodName;
 
    private Method commitMethod; // confirm 方法
 
    private String rollbackMethodName;
 
    private Method rollbackMethod; // cancel 方法
 
    // …… 省略
}

Seata解析到应用中存在TCC Bean,则通过parserRemotingServiceInfo方法生成一个TCCResource对象,进而调用TCCResourceManager类的registerResource方法,将TCCResource对象保存到本地的tccResourceCache中,它是一个ConcurrentHashMap结构,同时通过RmRpcClient将该TCCResourceresourceIdaddress等信息注册到服务端,便于后续TC通过RPC回调到正确的地址。

// 解析TCCResource的部分代码
Class<?> interfaceClass = remotingBeanDesc.getInterfaceClass();
Method[] methods = interfaceClass.getMethods();
if(isService(bean, beanName)){
    try {
        // 如果是 TCC service Bean,解析并注册该 resource
        Object targetBean = remotingBeanDesc.getTargetBean();
        for(Method m : methods){
            TwoPhaseBusinessAction twoPhaseBusinessAction = m.getAnnotation(TwoPhaseBusinessAction.class);
            if(twoPhaseBusinessAction != null){
                // 如果有 TCC 参与方注解,定义一个 TCCResource,
                TCCResource tccResource = new TCCResource();
                tccResource.setActionName(twoPhaseBusinessAction.name());
                // TCC Bean
                tccResource.setTargetBean(targetBean); 
                // try 方法
                tccResource.setPrepareMethod(m); 
                // confirm 方法名称
                tccResource.setCommitMethodName(twoPhaseBusinessAction.commitMethod());
                // confirm 方法对象
                tccResource.setCommitMethod(ReflectionUtil.getMethod(interfaceClass, twoPhaseBusinessAction.commitMethod(), new Class[]{BusinessActionContext.class}));
                // cancel 方法名称
                tccResource.setRollbackMethodName(twoPhaseBusinessAction.rollbackMethod());
                // cancel 方法对象
                tccResource.setRollbackMethod(ReflectionUtil.getMethod(interfaceClass, twoPhaseBusinessAction.rollbackMethod(), new Class[]{BusinessActionContext.class}));
                // 调用到 TCCResourceManager 的 registerResource 方法
                DefaultResourceManager.get().registerResource(tccResource);
            }
        }
    } catch (Throwable t) {
        throw new FrameworkException(t, "parser remting service error");
    }
}

我们看一下TCCResourceManagerregisterResource方法的实现:

// 内存中保存的resourceId和TCCResource的映射关系
private Map<String, Resource> tccResourceCache = new ConcurrentHashMap<String, Resource>();
 
@Override
public void registerResource(Resource resource) {
    TCCResource tccResource = (TCCResource) resource;
    tccResourceCache.put(tccResource.getResourceId(), tccResource);
    // 调用父类的方法通过 RPC 注册到远端
    super.registerResource(tccResource);
}

我们看下TCCResource是如何注册到服务端的:

public void registerResource(Resource resource) {
    // 拿到RmRpcClient实例,调用其registerResource方法
    RmRpcClient.getInstance().registerResource(resource.getResourceGroupId(), resource.getResourceId());
}
 
public void registerResource(String resourceGroupId, String resourceId) {
    if (LOGGER.isInfoEnabled()) {
        LOGGER.info("register to RM resourceId:" + resourceId);
    }
    synchronized (channels) {
        for (Map.Entry<String, Channel> entry : channels.entrySet()) {
            String serverAddress = entry.getKey();
            Channel rmChannel = entry.getValue();
            if (LOGGER.isInfoEnabled()) {
                LOGGER.info("register resource, resourceId:" + resourceId);
            }
            // 注册 resourceId,远端将其解析为一个 RpcContext 保存在内存中
            sendRegisterMessage(serverAddress, rmChannel, resourceId);
        }
    }
}

GlobalTransaction注册全局事务

GlobalTransaction注解是全局事务的入口,其切面逻辑实现在GlobalTransactionalInterceptor类中。如果判断进入@GlobalTransaction修饰的方法,会调用handleGlobalTransaction方法进入切面逻辑,其中关键方法是transactionalTemplateexecute方法。

public Object execute(TransactionalExecutor business) throws Throwable {
    // 如果上游已经有 xid 传过来说明自己是下游,直接参与到这个全局事务中就可以,不必新开一个,角色是 Participant
    // 如果上游没有 xid 传递过来,说明自己是发起方,新开启一个全局事务,角色是 Launcher
    GlobalTransaction tx = GlobalTransactionContext.getCurrentOrCreate();
    // …… …… 省略 
    try {
        // 开启全局事务
        beginTransaction(txInfo, tx); 
        Object rs = null;
        try {
            // 调用业务方法
            rs = business.execute();
        } catch (Throwable ex) {
            // 如果抛异常,通知 TC 回滚全局事务
            completeTransactionAfterThrowing(txInfo,tx,ex);
            throw ex;
        }
        // 如果不抛异常,通知 TC 提交全局事务
        commitTransaction(tx);
        return rs;
    } 
    // …… …… 省略
}

beginTransaction方法调用了transactionManagerbegin方法:

// 客户端
@Override
public String begin(String applicationId, String transactionServiceGroup, String name, int timeout)
    throws TransactionException {
    GlobalBeginRequest request = new GlobalBeginRequest();
    request.setTransactionName(name);
    request.setTimeout(timeout);
    // 发送 RPC,获取 TC 下发的 xid
    GlobalBeginResponse response = (GlobalBeginResponse)syncCall(request);
    return response.getXid();
}
 
// 服务端
@Override
public String begin(String applicationId, String transactionServiceGroup, String name, int timeout)
    throws TransactionException {
    // 全局事务用 GlobalSession 来表示
    GlobalSession session = GlobalSession.createGlobalSession(
        applicationId, transactionServiceGroup, name, timeout);
    session.addSessionLifecycleListener(SessionHolder.getRootSessionManager());
    // 将 GlobalSession 写入文件存储
    session.begin();
    // 返回 UUID 作为全局事务 ID
    return XID.generateXID(session.getTransactionId());
}

TwoPhaseBusinessAction注册分支事务

全局事务调用业务方法时,会进入TCC参与方的切面逻辑,主要实现在TccActionInterceptor类中,关键方法是actionInterceptorHandlerproceed方法。

public Map<String, Object> proceed(Method method, Object[] arguments, TwoPhaseBusinessAction businessAction, Callback<Object> targetCallback) throws Throwable {
    
    // …… …… 省略
 
    // 创建分支事务
    String branchId = doTccActionLogStore(method, arguments, businessAction, actionContext);
    actionContext.setBranchId(branchId);
    
    // 记录方法参数
    Class<?>[] types = method.getParameterTypes();
    int argIndex = 0;
    for (Class<?> cls : types) {
        if (cls.getName().equals(BusinessActionContext.class.getName())) {
            arguments[argIndex] = actionContext;
            break;
        }
        argIndex++;
    }
    // …… …… 省略
}

doTccActionLogStore方法负责注册分支事务:

// 客户端
protected String doTccActionLogStore(Method method, Object[] arguments, TwoPhaseBusinessAction businessAction, BusinessActionContext actionContext) {
    String actionName = actionContext.getActionName();
    // 拿到全局事务 ID
    String xid = actionContext.getXid();
    
    // …… …… 省略
 
    try {
        // resourceManager 通过 RPC 向 TC 注册分支事务
        Long branchId = DefaultResourceManager.get().branchRegister(BranchType.TCC, actionName, null, xid, applicationContextStr, null);
        // 拿到 TC 返回的分支事务 ID
        return String.valueOf(branchId);
    }
    // …… …… 省略
}
 
// 服务端
@Override
public Long branchRegister(BranchType branchType, String resourceId, String clientId, String xid,
                            String applicationData, String lockKeys) throws TransactionException {
    GlobalSession globalSession = assertGlobalSession(XID.getTransactionId(xid), GlobalStatus.Begin);
    // 分支事务用 BranchSession 表示,新建一个 BranchSession
    BranchSession branchSession = SessionHelper.newBranchByGlobal(globalSession, branchType, resourceId,
        applicationData, lockKeys, clientId);
 
    if (!branchSession.lock()) {
        throw new TransactionException(LockKeyConflict);
    }
    try {
        // 将分支事务加入全局事务中,也会写文件
        globalSession.addBranch(branchSession);
    } catch (RuntimeException ex) {
        throw new TransactionException(FailedToAddBranch);
    }
    // 返回分支事务 ID
    return branchSession.getBranchId();
}

TC 回调参与方补偿方法

分支事务注册完毕,业务方法调用成功则通知TC提交全局事务。

@Override
public void commit() throws TransactionException {
    // 如果是参与者,无需发起提交请求
    if (role == GlobalTransactionRole.Participant) {
        return;
    }
    // 由 TM 向 TC 发出提交全局事务的请求
    status = transactionManager.commit(xid);
}

TC收到客户端TMcommit请求后:

@Override
public GlobalStatus commit(String xid) throws TransactionException {
    // 根据 xid 找出 GlobalSession
    GlobalSession globalSession = SessionHolder.findGlobalSession(XID.getTransactionId(xid));
    if (globalSession == null) {
        return GlobalStatus.Finished;
    }
    GlobalStatus status = globalSession.getStatus();
 
    // 关闭这个 GlobalSession,不让后续的分支事务再注册上来
    globalSession.closeAndClean(); 
 
    if (status == GlobalStatus.Begin) {
        // 修改状态为提交进行中
        globalSession.changeStatus(GlobalStatus.Committing);
        // 一旦分支事务中存在 TCC,做同步提交,其实 TCC 分支也可以异步提交,要求高性能时可以选择异步
        if (globalSession.canBeCommittedAsync()) {
            asyncCommit(globalSession);
        } else {
            doGlobalCommit(globalSession, false);
        }
    }
    return globalSession.getStatus();
}

doGlobalCommit是我们关注的关键方法,我们忽略其中的次要逻辑:

@Override
public void doGlobalCommit(GlobalSession globalSession, boolean retrying) throws TransactionException {
    for (BranchSession branchSession : globalSession.getSortedBranches()) {
        
        // …… …… 省略
 
        try {
            // 调用 DefaultCoordinator 的 branchCommit 方法做分支提交
            // 参数有分支事务 id,resourceId 用来寻找对应的 TCCResource 和补偿方法参数信息
            BranchStatus branchStatus = resourceManagerInbound.branchCommit(branchSession.getBranchType(),
                XID.generateXID(branchSession.getTransactionId()), branchSession.getBranchId(),
                branchSession.getResourceId(), branchSession.getApplicationData());
        }
    }
    // …… …… 省略
}

服务端的DefaultCoordinator类中的branchCommit方法发出RPC请求,调用对应TCCResource提供方:

@Override
public BranchStatus branchCommit(BranchType branchType, String xid, long branchId, String resourceId,
                                    String applicationData)
    throws TransactionException {
    
    // …… …… 省略
    // 获取全局事务和分支事务
    GlobalSession globalSession = SessionHolder.findGlobalSession(XID.getTransactionId(xid));
        BranchSession branchSession = globalSession.getBranch(branchId);
    // 根据 resourceId 找到对应的 channel 和 RpcContext 
    BranchCommitResponse response = (BranchCommitResponse)messageSender.sendSyncRequest(resourceId,
        branchSession.getClientId(), request);
    // 返回分支事务提交状态
    return response.getBranchStatus();
 
    // …… …… 省略
}

客户端自然是接收到分支提交的RPC请求,然后本地找出之前解析并保持下来的,进行补偿方法的反射调用,下面我们截取其中的关键步骤进行分析。

@Override
public BranchStatus branchCommit(BranchType branchType, String xid, long branchId, String resourceId, String applicationData) throws TransactionException {
    // 根据 resourceId 找出内存中保留的 TCCResource 对象
    TCCResource tccResource = (TCCResource) tccResourceCache.get(resourceId);
    if(tccResource == null){
        throw new ShouldNeverHappenException("TCC resource is not exist, resourceId:" + resourceId);
    }
    // 获取 targetBean 和相应的 method 对象
    Object targetTCCBean = tccResource.getTargetBean();
    Method commitMethod = tccResource.getCommitMethod();
    try {
        boolean result = false;
        // 取出补偿方法参数信息
        BusinessActionContext businessActionContext = getBusinessActionContext(xid, branchId, resourceId, applicationData);
        // 反射调用补偿方法
        Object ret = commitMethod.invoke(targetTCCBean, businessActionContext);
        // 返回状态
        return result ? BranchStatus.PhaseTwo_Committed:BranchStatus.PhaseTwo_CommitFailed_Retryable;
    }
    // …… …… 省略
}

TC事务日志存储

关于Seata TC模块如何进行事务存储,网上有的文章已经讲得很详细,例如深度剖析一站式分布式事务方案Seata-Server,因此这里不再赘述。

需要提及的一点是,有可能成为整个分布式事务服务的性能瓶颈,因此如何做到高性能和高可用很重要,目前的存储方式是File,代码中也有关于DB Store ModeTODO项,文件相比于DB性能肯定好一些但是可用性会差一点,这块怎么保证要等到后续HA Cluster发布之后再看。

总结

整个Seata框架中关于TCC部分的源码并不复杂,本文只选取了部分类中的关键代码进行展示,忽略了一些判断逻辑和异常处理,笔者认为Seata TCC中关于TCC异常的封装和自定义处理、还有各种用户扩展埋点的设计也值得一看。

posted @ 2022-04-25 16:38  夏尔_717  阅读(259)  评论(0编辑  收藏  举报