shardingsphere核心分片-sql路由

sql路由作为数据分片的核心步骤在shardingSphere中由路由引擎来实现，通过解析引擎解析后的statement，提取关键的信息构建statementContext

为路由引擎提供支持。

我们从一条sql语句执行时去看看路由引擎如何路由的

    public ResultSet executeQuery() throws SQLException {
        ShardingSphereResultSet result;
        try {
　　　　　　　//清除上一次的缓存信息
            this.clearPrevious();
            //创建执行上下文
            this.executionContext = this.createExecutionContext();
            //调用执行器真正执行sql
            List<QueryResult> queryResults = this.executeQuery0();
            //结果归并，这是一个查询的sql可能会需要结果集进行归并
            MergedResult mergedResult = this.mergeQuery(queryResults);
            result = new ShardingSphereResultSet(this.getResultSetsForShardingSphereResultSet(), mergedResult, this, this.executionContext);
        } finally {
            this.clearBatch();
        }

        this.currentResultSet = result;
        return result;
    }

上述代码属于ShardingSpherePreparedStatement这个类，我们知道shardingsphere中sharding-jdbc实现分片功能是通过包装jdbc层来实现的，这里

就是包装了PreparedStatement。真正的路有隐情在创建执行上下文的时候会进行，执行上下文中包含了已经路由好的结果已经sql改写的结果。

进入这个创建执行上下文的方法

    private ExecutionContext createExecutionContext() {
        LogicSQL logicSQL = this.createLogicSQL();
        SQLCheckEngine.check(logicSQL.getSqlStatementContext().getSqlStatement(), logicSQL.getParameters(), this.metaDataContexts.getDefaultMetaData().getRuleMetaData().getRules(), "logic_db", this.metaDataContexts.getMetaDataMap(), (Grantee)null);
        ExecutionContext result = this.kernelProcessor.generateExecutionContext(logicSQL, this.metaDataContexts.getDefaultMetaData(), this.metaDataContexts.getProps());
        this.findGeneratedKey(result).ifPresent((generatedKey) -> {
            this.generatedValues.addAll(generatedKey.getGeneratedValues());
        });
        return result;
    }

在这里第一步创建LogicSQL这样一个对象，这个对象比较简单，里面包含了StatementContext、当前的sql以及向sql中设置的参数信息。

第二步通过SQLCheckEngine对SQL进行检查，校验合法性等信息，这个校验我看shardingShpere中没有具体的实现SQLChecker的类，

通过shardingsphere这种SPI实现的微内核架构，我们可以快速的将自己的SQLChecker注册到shardingSphere中进行我们自定义的校验。

接下来第三部就是通过核心处理器来真正生成执行上下文。

    public ExecutionContext generateExecutionContext(LogicSQL logicSQL, ShardingSphereMetaData metaData, ConfigurationProperties props) {
        RouteContext routeContext = this.route(logicSQL, metaData, props);
        SQLRewriteResult rewriteResult = this.rewrite(logicSQL, metaData, props, routeContext);
        ExecutionContext result = this.createExecutionContext(logicSQL, metaData, routeContext, rewriteResult);
        this.logSQL(logicSQL, props, result);
        return result;
    }

进入我们的KernelProcessor类，这里我们终于看到了路由的真正入口。这个方法中第一步就是路由之后进行sql改写然后将结果生成执行上下文。

接下来就会通过路由引擎执行路由逻辑

    public RouteContext route(LogicSQL logicSQL, ShardingSphereMetaData metaData) {
        SQLRouteExecutor executor = this.isNeedAllSchemas(logicSQL.getSqlStatementContext().getSqlStatement()) ? new AllSQLRouteExecutor() : new PartialSQLRouteExecutor(this.rules, this.props);
        return ((SQLRouteExecutor)executor).route(logicSQL, metaData);
    }

通过SQLRouteExecutor路由执行器来进行路由，其中第一步会进行一个路由器的选择，如果我们的SQL类型属于MySQLShowTablesStatement这时会创建一个AllSQLRouteExecutor,否则

则会创建PartialSQLRouteExecutor。MySQLShowTablesStatement包含什么？比如就是 show tables这条语句，AllSQLRouteExecutor顾名思义就是一个全部路由，里面的路由返回的结果

就是将我们所有的数据库配置和表配置组成对应的节点返回。重点是我们的PartialSQLRouteExecutor。

    public PartialSQLRouteExecutor(final Collection<ShardingSphereRule> rules, final ConfigurationProperties props) {
        this.props = props;
        routers = OrderedSPIRegistry.getRegisteredServices(SQLRouter.class, rules);
    }
    
    @Override
    @SuppressWarnings({"unchecked", "rawtypes"})
    public RouteContext route(final LogicSQL logicSQL, final ShardingSphereMetaData metaData) {
        RouteContext result = new RouteContext();
        for (Entry<ShardingSphereRule, SQLRouter> entry : routers.entrySet()) {
            if (result.getRouteUnits().isEmpty()) {
                result = entry.getValue().createRouteContext(logicSQL, metaData, entry.getKey(), props);
            } else {
                entry.getValue().decorateRouteContext(result, logicSQL, metaData, entry.getKey(), props);
            }
        }
        if (result.getRouteUnits().isEmpty() && 1 == metaData.getResource().getDataSources().size()) {
            String singleDataSourceName = metaData.getResource().getDataSources().keySet().iterator().next();
            result.getRouteUnits().add(new RouteUnit(new RouteMapper(singleDataSourceName, singleDataSourceName), Collections.emptyList()));
        }
        return result;
    }

在PartialSQLRouteExecutor中主要有一个构造器和route方法，在构造器里根据rules（分片规则）去获取了所有的SQLRouter，包括shardingSQLRouter、ReadwriteSplittingSQLRouter、ShadowSQLRouter

等。我们现在配置的Rules只有shardingRules也就是分库分表的规则配置，并不涉及读写分离的规则或者影子库的规则等，没有与之共同使用。所以这里根据ruls获取的SQLRouter

只有我们的ShardingSQLRouter进行分库分表的路由配置。

通过shardingSQLRouter进入我们的构造上下文

    public RouteContext createRouteContext(final LogicSQL logicSQL, final ShardingSphereMetaData metaData, final ShardingRule rule, final ConfigurationProperties props) {
        RouteContext result = new RouteContext();
        SQLStatement sqlStatement = logicSQL.getSqlStatementContext().getSqlStatement();
        Optional<ShardingStatementValidator> validator = ShardingStatementValidatorFactory.newInstance(sqlStatement);
        validator.ifPresent(optional -> optional.preValidate(rule, logicSQL.getSqlStatementContext(), logicSQL.getParameters(), metaData.getSchema()));
        ShardingConditions shardingConditions = createShardingConditions(logicSQL, metaData, rule);
        boolean needMergeShardingValues = isNeedMergeShardingValues(logicSQL.getSqlStatementContext(), rule);
        if (sqlStatement instanceof DMLStatement && needMergeShardingValues) {
            mergeShardingConditions(shardingConditions);
        }
        ShardingRouteEngineFactory.newInstance(rule, metaData, logicSQL.getSqlStatementContext(), shardingConditions, props).route(result, rule);
        validator.ifPresent(v -> v.postValidate(rule, logicSQL.getSqlStatementContext(), result, metaData.getSchema()));
        return result;
    }

在这个构建上下文的方法中，主要对Statement进行一个校验，之后创建shardingConditions,shardingConditions就是分片条件，里面包含了我们分片键的列名以及分片键的值。

可以看到：

这是shardingConditions里面有一个ShardingCondition的list，里面存储了每个分片键以及对应的信息。这里我作为演示的是使用的标准分片策略用来处理单键分片，

而且是一个精确分片算法，不是between 、in这种范围分片。我们可以看到我们的分片键order_id以及分片键的值为90。这些信息就是通过我们sql解析时生成的statement

对象和参数信息生成的。之后就可以根据这些conditions信息进行路由。

之后进入我们的shardingRouteEngine中的getDataNodes方法中。

   private Collection<DataNode> getDataNodes(final ShardingRule shardingRule, final TableRule tableRule) {
        ShardingStrategy databaseShardingStrategy = createShardingStrategy(shardingRule.getDatabaseShardingStrategyConfiguration(tableRule), shardingRule.getShardingAlgorithms());
        ShardingStrategy tableShardingStrategy = createShardingStrategy(shardingRule.getTableShardingStrategyConfiguration(tableRule), shardingRule.getShardingAlgorithms());
        if (isRoutingByHint(shardingRule, tableRule)) {
            return routeByHint(tableRule, databaseShardingStrategy, tableShardingStrategy);
        }
        if (isRoutingByShardingConditions(shardingRule, tableRule)) {
            return routeByShardingConditions(shardingRule, tableRule, databaseShardingStrategy, tableShardingStrategy);
        }
        return routeByMixedConditions(shardingRule, tableRule, databaseShardingStrategy, tableShardingStrategy);
    }

在这里我们datasource的配置和table的配置都使用的是标准分片策略，所以shardingsphere这里选择是 ShardingStandardRoutingEngine来进行处理。

通过这个方法我们可以看到，首先会根据配置的分片策略和算法去创建对应的表的和数据库的ShardingStrategy，在demo中这里两个都是StandardShardingStrategy。

值得一提的是 shardingSphere支持四种策略，标准分片策略、强制路由、复杂分片策略以及不分片策略。标准分片策略用来处理单键分片，与标准分片算法

配合；复杂分片策略用于处理多个分片键的路由与复杂分片算法配置。强制路由使用HintManager自定义传入分片值以及自定义算法实现。不分片策略则是没有分片的

情况下可以使用。

通过判断是否强制路由或者根据condition分片路由来决定如何路由，如果数据库或者表其中一个是hint方式另一个是分片方式则会进行混合路由。

进入分片路由逻辑：

    private Collection<DataNode> routeByShardingConditions(final ShardingRule shardingRule, final TableRule tableRule, 
                                                           final ShardingStrategy databaseShardingStrategy, final ShardingStrategy tableShardingStrategy) {
        return shardingConditions.getConditions().isEmpty()
                ? route0(tableRule, databaseShardingStrategy, Collections.emptyList(), tableShardingStrategy, Collections.emptyList())
                : routeByShardingConditionsWithCondition(shardingRule, tableRule, databaseShardingStrategy, tableShardingStrategy);
    }

判断conditions是否为空如果为空则传入一个emptyList直接进行真正的路由，否则遍历我们的conditions通过condition进行路由。

    private Collection<DataNode> route0(final TableRule tableRule, 
                                        final ShardingStrategy databaseShardingStrategy, final List<ShardingConditionValue> databaseShardingValues, 
                                        final ShardingStrategy tableShardingStrategy, final List<ShardingConditionValue> tableShardingValues) {
        Collection<String> routedDataSources = routeDataSources(tableRule, databaseShardingStrategy, databaseShardingValues);
        Collection<DataNode> result = new LinkedList<>();
        for (String each : routedDataSources) {
            result.addAll(routeTables(tableRule, each, tableShardingStrategy, tableShardingValues));
        }
        return result;
    }

将通过condition解析好的对应的数据库分片键以及表的分片键构建为List类型的ShardingConditionValue，这个shardingVlue就包含了分片键的名称以及值。

先通过数据库的ShardingConditionValue去路由所用的数据库，在根据表的ShardingConditionValue去路由表，然后将路由的每一个表节点添加至上一步路由

后的每一个数据库节点。这样所有需要访问的数据节点就已经确定了。

我们看一下具体是如何路由的

    public Collection<String> doSharding(final Collection<String> availableTargetNames, final Collection<ShardingConditionValue> shardingConditionValues, final ConfigurationProperties props) {
        ShardingConditionValue shardingConditionValue = shardingConditionValues.iterator().next();
        Collection<String> shardingResult = shardingConditionValue instanceof ListShardingConditionValue
                ? doSharding(availableTargetNames, (ListShardingConditionValue) shardingConditionValue) : doSharding(availableTargetNames, (RangeShardingConditionValue) shardingConditionValue);
        Collection<String> result = new TreeSet<>(String.CASE_INSENSITIVE_ORDER);
        result.addAll(shardingResult);
        return result;
    }

我们可以看分片策略类中的doSharding方法，这里会最终调用配合我们策略使用的算法中的doSharding来实现真正的计算。

主要看一下dmeo中的分片算法使用，这里时用了shardingSphere的内置INLINE算法。

    @Override
    public String doSharding(final Collection<String> availableTargetNames, final PreciseShardingValue<Comparable<?>> shardingValue) {
        Closure<?> closure = createClosure();
        closure.setProperty(shardingValue.getColumnName(), shardingValue.getValue());
        return closure.call().toString();
    }
    
    @Override
    public Collection<String> doSharding(final Collection<String> availableTargetNames, final RangeShardingValue<Comparable<?>> shardingValue) {
        if (allowRangeQuery) {
            return availableTargetNames;
        }
        throw new UnsupportedOperationException("Since the property of `" + ALLOW_RANGE_QUERY_KEY + "` is false, inline sharding algorithm can not tackle with range query.");
    }

INLINE算法就是我们提供一个行表达式，之后shardingSphere通过计算表达式的值来确定具体路由的结构。比如表的INLINE分片算法的表达式 t_order_${order_id % 2}

最终shardingSphere就会跟个order_id的值对2进行取模组成真正的表结点如 t_order_0或者t_order_1。

我们可以看到这个类有两个doSharding的方法。第一个是精确分片这里时处理 = 和 in这种分片键的，因为这里所有的分片值我们可以枚举出来。对于in中多个值会进行循环

处理，每次传入一个确定的值。

第二个方法是针对范围分片的，主要用来处理 between and , < , >,<=,>=的，这些分片值都是一个范围的东西。当然INLINE算法一般不支持范围分片的。如果允许范围分片

它就会返回所有可用的表或者数据源信息。

以上就上路由的全部流程，当然里面有些部分和细节没有写出来，以后会仔细研究一下在补充。

posted @ 2021-08-30 23:52 她曾是他的梦阅读(767) 评论(0) 收藏举报

刷新页面返回顶部

shardingsphere核心分片-sql路由

公告