ShardedJedisPipeline 源码分析

一、什么是pipeline？什么是ShardedJedis?

由于pipeline和ShardedJedis的介绍和源码分析在网上已经有了，本文就不再赘述，直接给出链接：

pipeline的介绍：
http://blog.csdn.net/freebird_lb/article/details/7778919

pipeline源码分析：
http://blog.csdn.net/ouyang111222/article/details/50942893

ShardedJedis :
http://blog.csdn.net/ouyang111222/article/details/50958062

请读者在继续阅读之前确保自己掌握了pipeline和shardedJedis的概念。

二、ShardedJedisPipeline源码分析

1：怎么使用？

如同名字一样，ShardedJedisPipeline是分布式异步调用的方式，即后端支持多台Redis实例，并且可以从客户端以pipeline的方式打包发送命令，先来看看怎么使用：

    public static void main(String[] args) {
        List<JedisShardInfo> shards = Arrays.asList(
                new JedisShardInfo("IP1", 6379),
                new JedisShardInfo("IP2", 6379),
                new JedisShardInfo("IP3", 6379)
        );
        ShardedJedis shardedJedis = new ShardedJedis(shards);
        ShardedJedisPipeline shardedJedisPipeline = shardedJedis.pipelined();
        for (int i = 0; i < 10; i++) {
            shardedJedisPipeline.set("k" + i, "v" + i);
        }
        shardedJedisPipeline.sync();
    }

因为客户端有Hash算法，所以在for循环中set的k1~k9会被打散分配到三台机器上（为了模拟效果，也可以在同一台机器上启动三个Redis实例），下面是分别去三台机器上查看key的分布情况：

第一台：
127.0.0.1:6379> keys k*
1) "k2"
2) "k0"

第二台：
127.0.0.1:6379> keys k*
1) "k4"
2) "k5"
3) "k3"
4) "k9"
5) "k8"

第三台：
127.0.0.1:6379> keys k*
1) "k1"
2) "k6"
3) "k7"

如上所示，k1 ~ k9 分别在不同的机器上，我们接下来把数据拿回来：

        for (int i = 0; i < 10; i++) {
            shardedJedisPipeline.get("k"+i);
        }
        List<Object> list = shardedJedisPipeline.syncAndReturnAll();
        for(Object obj:list) {
            System.out.println(obj);
        }

执行结果如下：

这时候难道不应该思考一个问题吗？

虽然我们get操作是依次 get k1 ~ k9 ,但是由于k1 ~ k9分别在不同的机器上，怎么保证他们回来的顺序呢？请在继续往下看之前先思考这个问题你会怎么解决。

2：开始分析

首先整一份Jedis的源码下来，推荐用IDEA打开，因为IDEA有功能可以生成类的调用图http://blog.csdn.net/qq_27093465/article/details/52857307，我生成的类图如下所示：

可以看到ShardedJedisPipeline继承自PipelineBase，继续继承自Queable。我们从get的代码开始，注意看我的注释，我保证以最简单的方式解释清楚这个问题：

shardedJedisPipeline.get("k"+i);

它的实现在PipelineBase中：

    public Response<String> get(String key) {
        this.getClient(key).get(key);   
        return this.getResponse(BuilderFactory.STRING);
    }

我们接着去看看getClient(key) ：

    protected Client getClient(String key) {
        /*getShard对key做HASH，同时返回这个key对应的client对象，一个client对象就代表了一条连接，此时返回的对象和set的时候后端对应的Redis机器IP和PORT是一样的，这样才能保证这条get命令发出去能去正确的机器上拿回数据*/
        Client client = jedis.getShard(key).getClient();

        /*！！！ 关键点
         private Queue<Client> clients = new LinkedList<Client>(); 
        上面是clients的定义，是一个队列，它会按照client的使用顺序把它入队，相当于按照顺序保存了每个命令对应的连接（保存的本地端口是关键），因为回来的时候就按照这个顺序依次去端口读取数据了*/
        clients.add(client);
        results.add(new FutureResult(client));
        return client; //最后把client返回
    }

再回去看 this.getClient(key).get(key)其实相当于调用 client.get(key)，这样会把这条命令添加到outputstream，但是不会发送，（因为是pipeline的方式，最后才会统一刷新输出流）this.getResponse(BuilderFactory.STRING)相当于为每个回来的包准备一块空间。

接下来我们调用了：

List<Object> list = shardedJedisPipeline.syncAndReturnAll();

去看看syncAndReturnAll()方法：

 public List<Object> syncAndReturnAll() {
    List<Object> formatted = new ArrayList<Object>();

    /* 遍历clients 队列，按照先进先出的规则，依次从每个client对象拿出一条(getOne())返回结果。看下面的图解。
    */
    for (Client client : clients) {
      formatted.add(generateResponse(client.getOne()).get());
    }
    /*将结果添加到formatted返回*/
    return formatted;
  }

说明：

因为有三台Redis服务器，所以会有三条socket连接，假设他们对应的本地端口为3333，6666，9999，后面是每个连接的接收缓冲区。
Redis服务器是单线程，所以每条连接上接收缓冲区返回的结果一定是按照顺序的，比如发送按照getk0,getk2的顺序，则结果也是按照这样返回。
clients队列中记录了每个client对象，它能标识这条get命令应该去哪个本地端口读取数据，getone按照Redis协议分隔读取一条就是相应的结果

就这样依次出队，依次解析，现在我们假设队列读取到了最后的三条，则情况如下：

3：总结

其实这种方法很巧妙的原因也得益于Redis是一个单线程的服务器，对于发送向它的命令，总是按照发送的顺序返回，也正是这样，才能有pipeline这种方式，不然多线程各自都有自己的缓冲区，自己如果处理完就返回了，这样是没法玩的。

posted on 2017-06-18 10:50 杨博东的博客阅读(72) 评论(0) 收藏举报

刷新页面返回顶部