Redis的Pipeline、事务和lua

1. Pipeline

1.1 Pipeline概念

　　Redis客户端执行一条命令分别为如下4个过程：

1) 发送命令

2) 命令排队

3) 命令执行

4) 返回结果

　　其中1)+4)称为Round Trip Time（RTT，往返时间）。

　　Redis提供了批量操作命令（例如mget、mset等)，有效地节约RTT。但大部分命令是不支持批量操作的，例如要执行n 次 hgetall命令，并没有mhgetall命令存在，需要消耗n次RTT。Redis的客户端和服务端可能部署在不同的机器上。例如客户端在北京，Redis服务端在上海，两地直线距离约为1300公里，那么1次 RTT时间=1300 x 2/ ( 300000 x 2/3 ) =13毫秒（光在真空中传输速度为每秒30万公里，这里假设光纤为光速的2/3),那么客户端在1秒内大约只能执行80次左右的命令，这个和Redis的高并发高吞吐特性背道而驰。

　　Pipeline (流水线）机制能改善上面这类问题，它能将一组Redis命令进行组装，通过一次RTT传输给Redis, 再将这组 Redis命令的执行结果按顺序返回给客户端，图3-5为没有使用Pipeline执行了n条命令，整个过程需需要n次RTT。

　　图3-6为使用Pipeline执行了n次命令，整个过程需要1次 RTT。

　　Pipeline并不是什么新的技术或机制，很多技术上都使用过。而且RTT在不同网络环境下会有不同，例如同机房和同机器会比较快，跨机房跨地区会比较慢。Redis命令真正执行的时间通常在微秒级别，所以才会有Redis性能瓶颈是网络这样的说法。

　　redis-cli的--pipe选项实际上就是使用Pipeline机制，例如下面操作将set hello world和incr counter两条命令组装:

echo -en  ' *3\r\n$3\r\nSET\r\n$5\r\nhello\r\n$5\r\nworld\r\n*2\r\n$4\r\nincr\r\n$7\r\ncounter\r\n'  | redis-cli --pipe

　　但大部分开发人员更倾向于使用高级语言客户端中的Pipeline，目前大部分Redis客户端都支持Pipeline。

1.2 性能测试

　　表3-1给出了在不同网络环境下非Pipeline和 Pipeline执行10000次 set操作的效果，可以得到如下两个结论：

□ Pipeline执行速度一般比逐条执行要快。

□ 客户端和服务端的网络延时越大，Pipeline的效果越明显。

表 3-1 在不同网络下，10000条set非Pipeline和 Pipeline的执行时间对比
网络	延迟	非 Pipeline	Pipeline
本机	0.17ms	573ms	134ms
内网服务器	0.41ms	1610ms	240ms
异地机房	7ms	78499ms	1104ms

1.3 原生批量命令与Pipeline对比

　　可以使用Pipeline模拟出批量操作的效果，但是在使用时要注意它与原生批量命令的区别，具体包含以下几点：

口原生批量命令是原子的，Pipeline是非原子的。

口原生批量命令是一个命令对应多个key, Pipeline支持多个命令。

□原生批量命令是Redis服务端支持实现的，而 Pipeline需要服务端和客户端的共同实现。

1.4 最佳实践

　　Pipeline虽然好用，但是每次Pipeline组装的命令个数不能没有节制，否则一次组装Pipeline数据量过大，一方面会增加客户端的等待时间，另一方面会造成一定的网络阻塞，可以将一次包含大量命令的Pipeline拆分成多次较小的Pipeline来完成。

　　Pipeline只能操作一个Redis实例，但是即使在分布式Redis场景中，也可以作为批量操作的重要优化手段。

2.事务与Lua

　　为了保证多条命令组合的原子性，Redis提供了简单的事务功能以及集成Lua脚本来解决这个问题。本节首先简单介绍Redis中事务的使用方法以及它的局限性，之后重点介绍Lua语言的基本使用方法，以及如何将Redis和Lua脚本进行集成，最后给出Redis管理Lua脚本的相关命令。

2.1 事务

　　熟悉关系型数据库的读者应该对事务比较了解，简单地说，事务表示一组动作，要么全部执行，要么全部不执行。例如在社交网站上用户A 关注了用户B, 那么需要在用户A 的关注表中加入用户B，并且在用户B 的粉丝表中添加用户A, 这两个行为要么全部执行，要么全部不执行，否则会出现数据不一致的情况。

　　Redis提供了简单的事务功能，将一组需要一起执行的命令放到multi和exec两个命令之间。multi命令代表事务开始，exec命令代表事务结束，它们之间的命令是原子顺序执行的，例如下面操作实现了上述用户关注问题。

127.0.0.1:6379> multi
OK
127.0.0.1:6379> sadd user:a :follow user:b
QUEUED
127.0.0.1:6379> sadd user:b:fans user:a
QUEUED

　　可以看到sadd命令此时的返回结果是QUEUED, 代表命令并没有真正执行，而是暂时保存在Redis中。如果此时另一个客户端执行sismember user:a:follow user:b 返回结果应该为0。

127.0.0.1:6379> sismember user:a:follow user:b
(integer) 0

　　只有当exec执行后，用户A 关注用户B 的行为才算完成，如下所示返回的两个结果对应 sadd命令。

127.0.0.1:6379> exec
1) (integer) 1
2) (integer) 1
127.0.0.1:6379> sismember user:a:follow user:b
(integer) 1

　　如果要停止事务的执行，可以使用discard命令代替exec命令即可。

127.0.0.1:6379> discard
OK
127.0.0.1:6379> sismember user:a:follow user:b
(integer) 0

　　如果事务中的命令出现错误，Redis的处理机制也不尽相同。

1.命令错误

　　例如下面操作错将set写成了 sett, 属于语法错误，会造成整个事务无法执行，key和counter的值未发生变化.

127.0.0.1:6388> mget key counter
1) "hello "
2) "100 "
127.0.0.1:6388> multi
OK
127.0.0.1:6388> sett key world
(error) ERR unknown command ' sett'
127.0.0.1:6388> incr counter
QUEUED
127.0.0.1:6388> exec
(error) EXECABORT Transaction discarded because of previous errors.
127.0.0.1:6388> mget key counter
1)  "hello "
2)  "100

　　2.运行时错误

　　例如用户B 在添加粉丝列表时，误把sadd命令写成了 zadd命令，这种就是运行时命令，因为语法是正确的:

127.0.0.1:6379> multi
OK
127.0.0.1:6379> sadd user:a:follow user:b
QUEUED
127.0.0.1:6379> zadd user:b:fans 1 user:a
QUEUED
127.0.0.1:6379> exec
1) (integer) 1
2) (error) WRONGTYPE Operation against a key holding the wrong kind of value
127.0.0.1:6379> sismember user:a:follow user:b
(integer) 1

　　可以看到Redis并不支持回滚功能，sadd user:a:follow user:b命令已经执行成开发人员需要自己修复这类问题。

　　有些应用场景需要在事务之前，确保事务中的key没有被其他客户端修改过，才执行事务，否则不执行（类似乐观锁)。Redis提供了 watch命令来解决这类问题，表 3-2展示两个客户端执行命令的时序。

表 3-2事务中 watch命令演示时序
时间点	客户端-1	客户端-2
T1	set key "java"
T2	watch key
T3	multi
T4		append key python
T5	append key jedis
T6	exec
T7	get key

　　可以看到“客户端-1”执行multi之前执行了watch命令，“客户端-2”在“客户端-1”执行exec之前修改了key值，造成事务没有执行（exec结果为nil)，整个代码如下所示：

#T1:客户端 1
127.0.0.1:6379 > set key "java"
OK
#T2:客户端 1
127.0.0.1:6379> watch key
OK
#T3:客户端 1
127.0.0.1:6379> multi
OK
#T4:客户端 2
127.0.0.1:6379> append key python
(integer) 11
#T5:客户端 1
127.0.0.1:6379> append key jedis
QUEUED
#T6:客户端 1
127.0.0.1:6379> exec
(nil)
#T7:客户端 1
127.0.0.1:6379>  get key
"javapython"

　　Redis提供了简单的事务，之所以说它简单，主要是因为它不支持事务中的回滚特性，同时无法实现命令之间的逻辑关系计算，当然也体现了 Redis的 “keep it simple”的特性，下一小节介绍的Lua脚本同样可以实现事务的相关功能，但是功能要强大很多。

2.2 Lua用法简述

　　Lua语言是在1993年由巴西一个大学研究小组发明，其设计目标是作为嵌人式程序移植到其他应用程序，它是由C语言实现的，虽然简单小巧但是功能强大，所以许多应用都选用它作为脚本语言，尤其是在游戏领域，例如大名鼎鼎的暴雪公司将Lua语言引入到“魔兽世界”这款游戏中，Rovio公司将Lua语言作为“愤怒的小鸟”这款火爆游戏的关卡升级引擎，Web服务器Nginx将 Lua语言作为扩展，增强自身功能。Redis将 Lua作为脚本语言可帮助开发者定制自己的Redis命令，在这之前，必须修改源码。在介绍如何在Redis中使用Lua脚本之前，有必要对Lua语言的使用做一个基本的介绍。

　　1.数据类型及其逻辑处理

　　Lua语言提供了如下几种数据类型：booleans (布尔)、numbers (数值)、strings (字符串)、tables(表格)，和许多髙级语言相比，相对简单。下面将结合例子对Lua的基本数据类型和逻辑处理进行说明。

　　(1) 字符串

　　下面定义一个字符串类型的数据：

local strings val = "world"

　　其中，local代表val是一个局部变量，如果没有local代表是全局变量。print函数可以打印出变量的值，例如下面代码将打印world, 其中是Lua语言的注释。

- - 结果是 "world"
print (hello)

(2) 数组

　　在 Lua中，如果要使用类似数组的功能，可以用tables类型，下面代码使用定义了一个 tables类型的变量myArray,但和大多数编程语言不同的是，Lua的数组下标从1开始计算：

local tables myArray = {"redis", "jedis", true, 88.0}
—true
print(myArray[3])

　　如果想遍历这个数组，可以使用for和 while, 这些关键字和许多编程语言是一致的。

　　(a) for

　　下面代码会计算1到 100的和，关键字for以 end作为结束符

local int sum = 0
for i = 1, 100
do
    sum = sum + i
end
- - 输出结果为 5050
print(sum)

　　要遍历myArray, 首先需要知道tables的长度，只需要在变量前加一个# 号即可：

for i = 1, #myArray
do
     print(myArray[ i ])
end

　　除此之外，Lua还提供了内置函数ipairs, 使用for index,value ipairs(tables)可以遍历出所有的索引下标和值。

for index,value in ipairs(myArray)
do
     print(index)
     print(value)
end

　　(b) while

　　下面代码同样会计算1到100的和，只不过使用的是While循环，while循环同样以end作为结束符。

local int sum = 0
local int i = 0
while i <= 100
do
     sum = sum +i
     i = i + 1
end
- - 输出结果为 5050
print(sum)

　　要确定数组中是否包含了jedis，有则打印true,注意if以end结尾，if后紧跟then：

local tables myArray = {" redis ", "jedis" , true, 88.0}
for i = 1, #myArray
do
        if myArray[i] == "jedis"
        then
              print ( "true" )
              break
else
              --do nothing
      end
end

(3) 哈希

　　如果要使用类似哈希的功能，同样可以使用tables类型，例如下面代码定义了一个ta bles,每个元素包含了key和value,其中stringsl .. string2是将两个字符串进行连接:

local tables user_l = {age = 28, name = "tome"}
--user_1 age is 28
print ( "user_1 age is"  .. user_1[ "age"])

　　如果要遍历user_l，可以使用Lua的内置函数pairs:

for key, value in pairs (user_1)
do print(key .. value)
end

2.函数定义

　　在Lua中，函数以function开头，以end结尾，funcName是函数名，中间部分是函数体：

function funcName()
      ...
end

　　contact函数将两个字符串拼接:

function contact(str1, str2 )
return str1 .. str2
end
- - " hello world"
print (contact ( "hello",  "world"))

2.3 Redis与Lua

　　1.在Redis中使用Lua

　　在Redis中执行lua脚本有两种方法：eval和 evalsha。

　　(1) eval

eval 脚本内容 key个数 key列表 参数列表

下面例子使用了key列表和参数列表来为Lua脚本提供更多的灵活性:

127.0.0.1:6379> eval 'return "hello "...KEYS[1]  ... ARGV[1]' 1 redis world
"hello redisworld"

　　此时 KEYS[l]=”redis"，ARGV[l]="world",所以最终的返回结果是"hello redis world"。

　　如果Lua脚本较长，还可以使用 redis-cli--eval直接执行文件。

　　eval 命令和--eval参数本质是一样的，客户端如果想执行Lua脚本，首先在客户端编写好Lua脚本代码，然后把脚本作为字符串发送给服务端，服务端会将执行结果返回给客户端，整个过程如图3-7所示。

　　(2) evalsha

除了使用 eval, Redis 还提供了evalsha 命令来执行 Lua 脚本。如图 3-8 所示，首先要将Lua脚本加载到Redis服务端，得到该脚本的SHA1校验和，evalsha 命令使用 SHA1作为参数可以直接执行对应 Lua 脚本，避免每次发送 Lua 脚本的开销。这样客户端就不需要每次执行脚本内容，而脚本也会常驻在服务端，脚本功能得到了复用。

加载脚本:script load命令可以将脚本内容加载Redi内存中，例如下面将lua_get.lua 加载到 Redis中,得到SHA1为:”7413dc2440dblfea7c0a0bde841fa68eefafl49c"

# redis-cli script load " $ (cat lua_get.lua )"
"7413dc2440dblfea7c0a0bde841fa68eefaf149c"

执行脚本：evalsha的使用方法如下，参数使用SHAl值，执行逻辑和eval—致。

evalsha 脚本 SHA1 值 key 个数 key 列表 参数列表

　　所以只需要执行如下操作，就可以调用lua_get.lua脚本:

127.0.0.1:6379> evalsha 7413dc2440dblfea7c0a0bde841fa68eefaf149c 1 redis world
"hello redisworld"

　　2.Lua的Redis API

　　Lua可以使用redis.call函数实现Redis的访问，例如下面代码是Lua使用redis.ca ll调用了Redis的set和get操作:

redis.call ( "set" , "hello",  "world")
redis.call ( "get",  "hello" )

　　放在Redis的执行效果如下:

127.0.0.1:6379> eval 'return redis.call ( "get", KEYS[1] )' 1 hello
"world"

　　除此之外Lua还可以使用redis.pcall函数实现对Redis的调用，redis.call和red is.pcall的不同在于，如果redis.call执行失败,那么脚本执行结束会直接返回错误，而 redis.pcall会忽略错误继续执行脚本，所以在实际开发中要根据具体的应用场景进行函数的选择。

2.4 案例

　　Lua脚本功能为Redis开发和运维人员带来如下三个好处：

口 Lua脚本在Redis中是原子执行的，执行过程中间不会插人其他命令。

□ Lua脚本可以帮助开发和运维人员创造出自己定制的命令，并可以将这些命令常驻在

　　Redis内存中，实现复用的效果。

□ Lua脚本可以将多条命令一次性打包，有效地减少网络开销。

　　下面以一个例子说明Lua脚本的使用，当前列表记录着热门用户的id, 假设这个列表有5个元素，如下所示:

127.0.0.1:6379> lrange hot:user:list 0 -1
1) "user:1:ratio"
2) "user:8:ratio"
3) "user:3:ratio"
4) "user:99:ratio"
5) "user:72:ratio"

　　user:{id}:ratio代表用户的热度，它本身又是一个字符串类型的键：

127.0.0.1:6379> mget user:1:ratio user:8:ratio user:3:ratio user:99:ratio user:72:ratio
1)  "986"
2)  "762"
3)  "w556"
4)  "400"
5)  "101"

　　现要求将列表内所有的键对应热度做加1操作，并且保证是原子执行，此功能可以利用Lua脚本来实现。

1) 将列表中所有元素取出，赋值给mylist:

local mylist = redis.call ( "lrange", KEYS[1 ], 0, -1)

2) 定义局部变量count= 0,这个count就是最后incr的总次数:

local count = 0

3) 遍历mylist中所有元素，每次做完count自增，最后返回count:

for index,key in ipairs (mylist)
do
     redis.call ( "incr" ,key)
     count = count + 1
end
return count

　　将上述脚本写人lrange_and_mincr.lua文件中，并执行如下操作，返回结果为5。

redis-cli --eval lrange_and_mincr.lua hot:user:list
(integer) 5

　　执行后所有用户的热度自增1:

127.0.0.1:6379> mget user:1:ratio user:8:ratio user:3:ratio user:99:ratio user:72:ratio
1)  "987"
2)  "763"
3)  "557"
4)  "401"
5)  "102

　　本节给出的只是一个简单的例子，在实际开发中，开发人员可以发挥自己的想象力创造出更多新的命令。

2.5 Redis 如何管理Lua 脚本

　　Redis提供了4个命令实现对Lua脚本的管理，下面分别介绍。

(1) script load

script load script

此命令用于将Lua脚本加载到Redis内存中，前面已经介绍并使用过了，这里不再赘述

(2) script exists

scripts exists sha1 [sha1 ...]

　　此命令用于判断shal是否已经加载到Redis内存中：

127.0.0.1:6379> script exists a5260dd66ce02462c5b5231c727b3f7772c0bcc5
1) (integer) 1

返回结果代表shal [shal ...]被加载到Redis内存的个数。

(3) script flush

script flush

此命令用于清除Redis内存已经加载的所有Lua脚本，在执行script flush后，a5260dd66ce02462c5b5231c727b3f7772c0bcc5不再存在:

127.0.0.1:6379> script exists a5260dd66ce02462c5b5231c727b3f7772c0bcc5
1)  (integer) 1
127.0.0.1:6379> script flush
OK
127.0.0.1:6379> script exists a5260dd66ce02462c5b5231c727b3f7772c0bcc5
1)  (integer) 0

(4) script kill

此命令用于杀掉正在执行的Lua脚本。如果Lua脚本比较耗时，甚至Lua脚本存在问题，那么此时Lua脚本的执行会阻塞Redis, 直到脚本执行完毕或者外部进行干预将其结束。下面我们模拟一个Lua脚本阻塞的情况进行说明。

下面的代码会使Lua进人死循环:

while 1 == 1
do
 
end

执行Lua脚本，当前客户端会阻塞：

127.0.0.1:6379> eval 'while 1==1 do end' 0

Redis提供了一个lua-time -limit参数，默认是5 秒，它是Lua脚本的“超时时间”，但这个超时时间仅仅是当Lua脚本时间超过lua-time-limit后，向其他命令调用发送BUSY的信号，但是并不会停止掉服务端和客户端的脚本执行，所以当达到lua-time-limit值之后，其他客户端在执行正常的命令时，将会收到“ Busy Redis is busy running ascript”错误，并且提示使用script kill或者shutdown nosave命令来杀掉这个busy的脚本:

127.0.0.1:6379> get hello
(error) BUSY Redis is busy running  a script . You can only call SCRIPT KILL or SHUTDOWN NOSAVE.

此时Redis已经阻塞，无法处理正常的调用，这时可以选择继续等待，但更多时候需要快速将脚本杀掉。使用shutdown save显然不太合适，所以选择script kill,当script

kill执行之后，客户端调用会恢复:

127.0.0.1:6379> script kill
OK
127.0.0.1:6379> get hello
"world"

但是有一点需要注意，如果当前Lua脚本正在执行写操作，那么script kill将不会生效。例如，我们模拟一个不停的写操作:

while 1==1
do
      redis.call( "set" ,"k","v")
end

此时如果执行script kill,会收到如下异常信息:

(error) UNKILLABLE Sorry the script already executed write commands against the
dataset. You can either wait the script termination or kill the server in a
hard way using the SHUTDOWN NOSAVE command.

上面提示Lua脚本正在向Redis执行写命令，要么等待脚本执行结束要么使用shutdown save停掉Redis服务。可见Lua脚本虽然好用，但是使用不当破坏性也是难以想象的。

posted @ 2021-04-23 19:45 小家电维修阅读(1078) 评论(0) 编辑收藏举报

刷新页面返回顶部

小家电维修