Java Redis的Pipeline管道,批量操作,节省大量网络往返时间 & Redis批量读写(hmset&hgetall) 使用Pipeline
一般情况下,大家使用redis去put/get都是先拿到一个jedis实例,然后操作,然后释放连接;这种模式是
请求-响应,请求-响应
这种模式,下一次请求必须得等第一次请求响应回来之后才可以,因为redis是单线程的,按部就班,一步一步来。
而pipeline管道改变了这种请求模式,客户端可以一次发送多个命令,无须等待服务器的返回,
请求,请求,请求,响应,响应,响应
这种模式
这就大大减少了影响性能的关键因素-网络往返时间
下面就上面两种模式以及JDK的map三者做一个性能比较
-
package redis;
-
-
import java.util.concurrent.BlockingQueue;
-
import java.util.concurrent.LinkedBlockingQueue;
-
-
import redis.clients.jedis.ShardedJedis;
-
import redis.clients.jedis.ShardedJedisPipeline;
-
-
/**
-
* @Type ShardRedisDemo.java
-
* @Desc
-
* @author chiwei
-
* @date 2016年6月13日 下午3:24:25
-
* @version
-
*/
-
public class ShardRedisDemo {
-
-
public static void main(String[] args) throws InterruptedException {
-
ShardRedisClient src = new ShardRedisClient();
-
src.setServers("redis://172.23.26.135:7379");
-
src.init();
-
int count = 10000;
-
ShardedJedis sj = src.getResource();
-
long begin = System.currentTimeMillis();
-
for (int i = 0; i < count; i++) {
-
sj.set("a" + i, "v" + i);
-
}
-
sj.close();
-
System.out.println(System.currentTimeMillis() - begin);
-
sj = src.getResource();
-
ShardedJedisPipeline p = sj.pipelined();
-
begin = System.currentTimeMillis();
-
for (int i = 0; i < count; i++) {
-
p.set("ap" + i, "vp" + i);
-
}
-
p.sync();
-
sj.close();
-
System.out.println(System.currentTimeMillis() - begin);
-
BlockingQueue<String> logQueue = new LinkedBlockingQueue<String>();
-
begin = System.currentTimeMillis();
-
for (int i = 0; i < count; i++) {
-
logQueue.put("i=" + i);
-
}
-
System.out.println(System.currentTimeMillis() - begin);
-
}
-
-
}
-
-
/**
-
* Revision history
-
* -------------------------------------------------------------------------
-
*
-
* Date Author Note
-
* -------------------------------------------------------------------------
-
* 2016年6月13日 chiwei create
-
*/
结果如下:
45027
116
11
大家看相对时间就行了,我测试时是经过VPN连的redis,由此结果可见pipeline的性能惊人的高。
但是pipeline适合于什么样的场景使用呢?
有些系统可能对可靠性要求很高,每次操作都需要立马知道这次操作是否成功,是否数据已经写进redis了,那这种场景就不适合。
还有的系统,可能是批量的将数据写入redis,允许一定比例的写入失败,那么这种场景就可以使用了,比如10000条一下进入redis,可能失败了2条无所谓,后期有补偿机制就行了,比如短信群发这种场景,如果一下群发10000条,按照第一种模式去实现,那这个请求过来,要很久才能给客户端响应,这个延迟就太长了,如果客户端请求设置了超时时间5秒,那肯定就抛出异常了,而且本身群发短信要求实时性也没那么高,这时候用pipeline最好了。
=======================================================================================================================
一般情况下,Redis Client端发出一个请求后,通常会阻塞并等待Redis服务端处理,Redis服务端处理完后请求命令后会将结果通过响应报文返回给Client。
这有点类似于HBase的Scan,通常是Client端获取每一条记录都是一次RPC调用服务端。
在Redis中,有没有类似HBase Scanner Caching的东西呢,一次请求,返回多条记录呢?
有,这就是Pipline。官方介绍 http://redis.io/topics/pipelining
通过pipeline方式当有大批量的操作时候,我们可以节省很多原来浪费在网络延迟的时间,需要注意到是用pipeline方式打包命令发送,redis必须在处理完所有命令前先缓存起所有命令的处理结果。打包的命令越多,缓存消耗内存也越多。所以并不是打包的命令越多越好。
使用Pipeline在对Redis批量读写的时候,性能上有非常大的提升。
使用Java测试了一下:
- package com.lxw1234.redis;
- import java.util.HashMap;
- import java.util.Map;
- import java.util.Set;
- import redis.clients.jedis.Jedis;
- import redis.clients.jedis.Pipeline;
- import redis.clients.jedis.Response;
- public class Test {
- public static void main(String[] args) throws Exception {
- Jedis redis = new Jedis("127.0.0.1", 6379, 400000);
- Map<String,String> data = new HashMap<String,String>();
- redis.select(8);
- redis.flushDB();
- //hmset
- long start = System.currentTimeMillis();
- //直接hmset
- for (int i=0;i<10000;i++) {
- data.clear();
- data.put("k_" + i, "v_" + i);
- redis.hmset("key_" + i, data);
- }
- long end = System.currentTimeMillis();
- System.out.println("dbsize:[" + redis.dbSize() + "] .. ");
- System.out.println("hmset without pipeline used [" + (end - start) / 1000 + "] seconds ..");
- redis.select(8);
- redis.flushDB();
- //使用pipeline hmset
- Pipeline p = redis.pipelined();
- start = System.currentTimeMillis();
- for (int i=0;i<10000;i++) {
- data.clear();
- data.put("k_" + i, "v_" + i);
- p.hmset("key_" + i, data);
- }
- p.sync();
- end = System.currentTimeMillis();
- System.out.println("dbsize:[" + redis.dbSize() + "] .. ");
- System.out.println("hmset with pipeline used [" + (end - start) / 1000 + "] seconds ..");
- //hmget
- Set keys = redis.keys("*");
- //直接使用Jedis hgetall
- start = System.currentTimeMillis();
- Map<String,Map<String,String>> result = new HashMap<String,Map<String,String>>();
- for(String key : keys) {
- result.put(key, redis.hgetAll(key));
- }
- end = System.currentTimeMillis();
- System.out.println("result size:[" + result.size() + "] ..");
- System.out.println("hgetAll without pipeline used [" + (end - start) / 1000 + "] seconds ..");
- //使用pipeline hgetall
- Map<String,Response<Map<String,String>>> responses = new HashMap<String,Response<Map<String,String>>>(keys.size());
- result.clear();
- start = System.currentTimeMillis();
- for(String key : keys) {
- responses.put(key, p.hgetAll(key));
- }
- p.sync();
- for(String k : responses.keySet()) {
- result.put(k, responses.get(k).get());
- }
- end = System.currentTimeMillis();
- System.out.println("result size:[" + result.size() + "] ..");
- System.out.println("hgetAll with pipeline used [" + (end - start) / 1000 + "] seconds ..");
- redis.disconnect();
- }
- }
测试结果如下:
- dbsize:[10000] ..
- hmset without pipeline used [243] seconds ..
- dbsize:[10000] ..
- hmset with pipeline used [0] seconds ..
- result size:[10000] ..
- hgetAll without pipeline used [243] seconds ..
- result size:[10000] ..
- hgetAll with pipeline used [0] seconds ..
使用pipeline来批量读写10000条记录,就是小菜一碟,秒完。
转自:https://blog.csdn.net/simonchi/article/details/52231674
转自:https://www.cnblogs.com/an7ing/p/5082243.html