redis代理对比，redis架构对比，redis predixy安装和功能测试

【0】代理功能与性能对比

目前市面上主流的代理包含：predixy、twemproxy、codis、redis-cerberus四款，这四款各有各的优势，我们逐个对比进行对比分析。

如上图，我们发现 twemproxy / codis 都不支持 redis-cluster，所以我们放弃使用；（但业界 codis 用的挺多的）

性能测试报告 2017：https://blog.csdn.net/rebaic/article/details/76384028

性能测试测试报告 2020：https://github.com/netease-im/camellia/blob/master/docs/redis-proxy/performance-report-8.md

redis架构发展：https://www.cnblogs.com/crazymakercircle/p/14282108.html

【1】predixy的安装和配置

【1.1】基本介绍

predixy 是高性能的适用于 redis 集群和哨兵的代理。

predixy github 地址：https://github.com/joyieldInc/predixy

predixy 编译安装需要 C++11 版本的编译器，至少需要 CentOS 7及以上版本才能编译安装。

对于 CentOS 6或更低版本，可以直接使用在 github release 中的二进制版本。

【1.2】特性、优点

同并轻量级
支持多线程
多平台支持：Linux、OSX、BSD、Windows( Cygwin )
支持Redis Sentinel，可配置一组或者多组redis
支持Redis集群
支持redis多种类型的命令，包括blpop、brpop、brpoplpush
支持扫描命令，无论是单个redis还是多个redis实例都支持
多键命令支持：mset/msetnx/mget/del/unlink/touch/exists
支持redis的多数据库，即可以使用select命令
支持事务，当前验证于Redis Sentinel下组redis组可用
支持脚本，包括命令：script load、eval、evalsha
支持发布订阅机制，也即Pub/Sub系列命令
多数据中心支持，删除支持
扩展的AUTH命令，部分的读、写、管理权限控制机制，健空间限制机制
日志可按级别输出，记录日志被io实时记录
日志文件可以按时间、大小自动切分
大量的统计信息，包括CPU、内存、请求、响应等信息
延迟监控信息，可以看到整体延迟，分秒还原事件延迟

【2】安装

【2.1】下载解压

tar -xzf predixy-1.0.5-bin-amd64-linux.tar.gz

mv predixy-1.0.5 /data/redis/

cd /data/redis/predixy-1.0.5/conf/

【2.2】修改配置文件 cluster.conf

配置文件官方说明：https://github.com/joyieldInc/predixy/blob/master/doc/config_CN.md

predixy 支持多种架构，由于使用的是 redis cluster，只需配置 redis cluster 对应的配置文件cluster.conf 即可。

内容如下：

##ClusterServerPool {

## [Password xxx] #default no

## [MasterReadPriority [0-100]] #default 50

## [StaticSlaveReadPriority [0-100]] #default 0

## [DynamicSlaveReadPriority [0-100]] #default 0

## [RefreshInterval number[s|ms|us]] #default 1, means 1 second

## [ServerTimeout number[s|ms|us]] #default 0, server connection socket read/write timeout

## [ServerFailureLimit number] #default 10

## [ServerRetryTimeout number[s|ms|us]] #default 1

## [KeepAlive seconds] #default 0, server connection tcp keepalive

# Examples:

ClusterServerPool {

Password 123456

MasterReadPriority 60

StaticSlaveReadPriority 50

DynamicSlaveReadPriority 50

RefreshInterval 1

ServerTimeout 1

ServerFailureLimit 10

ServerRetryTimeout 1

KeepAlive 120

Servers {

+ 192.168.191.176:6381

+ 192.168.191.176:6382

+ 192.168.191.211:6383

+ 192.168.191.211:6384

+ 192.168.191.70:6385

+ 192.168.191.70:6386

}

参数说明：

MasterReadPriority，StaticSlaveReadPriority，DynamicSlaveReadPriority 三个参数和 redis 本身配置文件中的 slave-priority 没任何关系的。

如果是自动发现找到的节点，则 DynamicSlaveReadPriority 会起作用，如果是直接配置的节点，则 StaticSlaveReadPriority 会起作用。

Master/SlaveReadPriority	Master	Slave1	Slave2	Fail-over notes
60/50	all requests	0 requests	0 requests	Master dead, read requests deliver to slave until master(maybe new master) alive
60/0	all requests	0 requests	0 requests	Master dead, all requests fail
50/50	all write requests, 33.33%read requests	33.33% read requests	33.33% read requests	-
0/50	all write requests, 0 read requests	50% read requests	50% read requests	all slaves dead, all read requests fail
10/50	all write requests, 0 read requests	50% read requests	50% read requests	all slaves dead, read requests deliver to master

RefreshInterval : predixy 获取节点信息和集群 hash slot 集群信息的间隔

ServerFailureLimit ： predixy 停止路由到节点之前失败的次数

ServerTimeout ：单个命令执行的超时时间

Password: 指定连接redis实例默认的密码，不指定的情况下表示redis不需要密码

【2.3】集群自动发现

在 Servers 部分配置集群中任意一个节点即可，predixy 会自动发现整个集群的信息，即使配置的节点挂掉后，predixy 代理仍然可正常工作。

通过自动发现集群，可以减少 cluster.conf 配置文件的修改及对 predixy 的重启操作。

但 predixy 无法删除曾经自动发现的节点，如果某节点下掉，predixy 仍会看到之前的节点，虽然不影响正常使用，日志则会不断报出错误信息。需重启 predixy 解决。

【2.4】配置 predixy.conf

Name Predixy001

Bind 0.0.0.0:7617

WorkerThreads 4

ClientTimeout 300

Log /data/redis/predixy-1.0.5/predixy.log

LogRotate 1d

LogRotate 200M

Include cluster.conf

注意 Include 部分，只需包括 cluster.conf，其他的则注释掉，否则可能会影响到 predixy的使用。

基本配置文件说明：

predixy.conf，整体配置文件，会引用下面的配置文件
cluster.conf，用于Redis Cluster时，配置后端redis信息
sentinel.conf，用于Redis Sentinel时，配置后端redis信息
auth.conf，代理中心访问权限控制配置，可以定义多个验证密码，可每个密码指定读、写、管理权限，以及定义可访问的健空间
dc.conf，多数据中心支持，可以定义读写分离规则，读流量权重分配
latency.conf，延迟监控规则定义，可以指定需要监控的命令以及延时时间间隔
command.conf，自定义命令扩展，用于命令扩展，支持redis 的插件以及自定义数据处理函数等
standalone.conf，使用单击模式的redis配置

【2.5】启动predixy

　　cd /data/redis/predixy-1.0.5/bin/

　　cp predixy /data/redis/bin/ #我的redis 启动命令在这里，已添加进环境比那里

启动

看情况任选一即可

nohup predixy /data/redis/predixy-1.0.5/conf/predixy.conf &

nohup predixy /data/redis/predixy-1.0.5/conf/predixy.conf >/data/redis/predixy-1.0.5/predixy.log 2>&1 &

查看日志

tail -f /data/redis/predixy-1.0.5/predixy.log

如上，我们可以看到，由于配置文件 predixy.conf 配置的确是启动了4个进程，所以我们4个线程都就绪连接到集群所有机器了；对应构建连接池

predixy 添加环境变量

在 /etc/profile 中添加，然后在 /etc/rc.local 中设置开机启动，任选一即可

echo 'nohup predixy /data/redis/predixy-1.0.5/conf/predixy.conf &' >> /etc/rc.local

nohup predixy /usr/local/predixy-1.0.5/conf/predixy.conf > /data/redis/predixy-1.0.5/predixy.log 2>&1 &

【3】连接核验

代理连接，直接连 7617 端口就行

redis-cli -p 7617 info

可以看到 mget mset 都是没有问题的

同时代理日志信息如下：

我们通过集群的方式连接，发现key 什么的确实过去了

【4】故障转移测试

【4.1】关闭一个主库

redis-cli -h 192.168.191.70 -p 6385 -a 123456 shutdown

tail -f /data/redis/predixy-1.0.5/predixy.log

我们可以发现，b2 之前是在 6385

故障转移之后，6382 从库，经过故障转移接替 6385 成为主库;

我们继续连接代理查询：

如上图，安稳查询那么，证明故障转移是可以的；程序连接的代理，不会感知到任何东西；

同时我们查看代理日志：

看这，和炸街了一样，一直报；

这就如同【2.3】说的

　　在 Servers 部分配置集群中任意一个节点即可，predixy 会自动发现整个集群的信息，即使配置的节点挂掉后，predixy 代理仍然可正常工作。

　　通过自动发现集群，可以减少 cluster.conf 配置文件的修改及对 predixy 的重启操作。

我们连接代理，在 info 中可以发现：

　　该配置信息依然在，但其状态 CurrentIsFail：1

总结：

代理可用，集群正常故障转移，程序无感；

运维问题：日志会一直报错；forget 也没用

【4.2】下掉一个从节点

我们下一个从节点看看；

我们下掉6383吧；

redis-cli -h 192.168.191.211 -p 6383 -a 123456 shutdown

查看代理日志：

会一直报错，连不上6383，直到去掉配置文件中的这个实例，重启代理

总结：

代理可用，集群正常故障转移，程序无感；

运维问题：日志会一直报错；forget 也没用

【4.3】关闭没有从库的主库（彻底关闭一对主从）

我们关闭 6386和6383这对主从吧，看看代理这时候会发生什么；

redis-cli -h 192.168.191.211 -p 6383 -a 123456 shutdown

redis-cli -h 192.168.191.70 -p 6386 -a 123456 shutdown

我们可以看到，现在redis-cluster 已经有问题了；

我们看看代理操作是什么情况；

我们发现是不能访问的！

集群参数：

集群参数也是没一个开的；

【4.4】代理下的集群参数测试，非全slot 可用性

我们这里就不测那么多了，测一个即可，节点先启动回去

然后我们测试 cluster-allow-reads-when-down yes 这个参数吧

redis-cli -h 192.168.191.176 -p 6381 -a 123456 config set cluster-allow-reads-when-down yes

redis-cli -h 192.168.191.176 -p 6382 -a 123456 config set cluster-allow-reads-when-down yes

redis-cli -h 192.168.191.211 -p 6383 -a 123456 config set cluster-allow-reads-when-down yes

redis-cli -h 192.168.191.211 -p 6384 -a 123456 config set cluster-allow-reads-when-down yes

redis-cli -h 192.168.191.70 -p 6385 -a 123456 config set cluster-allow-reads-when-down yes

redis-cli -h 192.168.191.70 -p 6386 -a 123456 config set cluster-allow-reads-when-down yes

然后继续关闭 6383 6386 一对主从的实例

redis-cli -h 192.168.191.211 -p 6383 -a 123456 shutdown

redis-cli -h 192.168.191.70 -p 6386 -a 123456 shutdown

然后我们看看代理，是否可以如之前测试那样，对现有key 是可以访问的；

我们发现，确实是这样；直连集群也是如此；

我们上主库实例上去把开关打开；仅剩的 2个主库全都开启这个参数；

直接连redis-cluster集群上稳稳的是可以set 了；如下图：

代理上也可以了对现有存在的 slot 的操作、不存在的key 也可以创建了；如下图：

代理日志，一直报，这是常态了，如下图

【5】集群水平扩展、收缩测试

【5.1】新增主节点

（1）新增 6387 主节点

redis-cli --cluster add-node 192.168.191.82:6387 192.168.191.176:6381 -a 123456

（2）自动平衡分配slot 给新空主节点 6387

redis-cli --cluster rebalance --cluster-use-empty-masters 192.168.191.176:6381 -a 123456

（3）check 一下看看现在的集群信息

（4）检查代理日志

如下图：

我们可以发现，新加入的主节点已经被自动发现且识别出来了；

（5）使用代理操作、查阅验证

我们用代理 mset 一下

如下图，我们连接redis-cluster 查阅验证，可以发现新的 key 的get set 已经完成，并且新的key 也分配到了新加的主库 6387

如下图，我们连接代理，使用Info 查看也可以看到该主库了，由于代理开了4个线程，所以现在的连接数是4，且如果线程不挂，一般会一直保持 connections为4的；

（6）结论

没有任何问题啊，就真如redis-cluster 一样

【5.2】新增从节点

redis-cli --cluster add-node 192.168.191.82:6388 192.168.191.176:6381 --cluster-slave -a 123456

如下图：加入成功

如下图：我们可以看到，代理自动识别出来了新的，木有问题啊

要是挂掉它，我们可以发现，代理的日志依然是会一直报，这表示只要有节点加入进来了，不管你是forget 还是 del-node，也不管你是否是 cluster.conf 文件中配置的集群ip；

反正只要是集群自动发现加入过的，它都会报；如果要去掉，只能重启代理

【5.3】删除一主一从，缩容

先删除从库：

redis-cli --cluster del-node 192.168.191.176:6381 45a9ea5062479aaad68b6a9c4b5cc1942639dcb4 -a 123456

再删主库：

（1）迁移被删除主库上的 slot

把槽位平均非给其他主节点

redis-cli -a 123456 --cluster rebalance --cluster-weight \

11ac5cf5004f22a55ee0afa2b221d120ad768f7d=1 f5dc23c602b57f6b09b4909d01289ff4d80220ed=1 \

4ba0958a0c9aa944962182673058fbc4c27952eb=1 4dfde05a131e9b8900553ef03ef41703737e449f=0 \

192.168.191.176:6381

（2）把节点从群集中移除，删除主节点

redis-cli -a 123456 --cluster del-node 192.168.191.176:6381 4dfde05a131e9b8900553ef03ef41703737e449f

（3）查看代理：

查看代理日志，如下图：

发现，居然没有报错（删除节点，但节点实例未关闭，所以它并没有报错，依然会连接该实例）

代理查看：

发现这2个都还在，这证明了，代理不会自动更新集群状态的删除信息，它只会自动更新新增的集群节点信息；

关闭这 6387 6388 实例；

我们发现，连不上又报错了；

【5.4】代理因为删除节点报错问题解决：重启代理

关闭：kill 进程

自动：predixy /data/redis/predixy-1.0.5/conf/predixy.conf &

重启后，报错信息没了；

登录代理：info 中的信息也更新了

6387 和 6388 实例就不见了；恢复正常;

【6】读写分离与读负载均衡的测试

Master/SlaveReadPriority	Master	Slave1	Slave2	Fail-over notes
60/50	all requests	0 requests	0 requests	Master dead, read requests deliver to slave until master(maybe new master) alive
60/0	all requests	0 requests	0 requests	Master dead, all requests fail
50/50	all write requests, 33.33%read requests	33.33% read requests	33.33% read requests	Master dead,read requests deliver to slave
0/50	all write requests, 0 read requests	50% read requests	50% read requests	all slaves dead, all read requests fail
10/50	all write requests, 0 read requests	50% read requests	50% read requests	all slaves dead, read requests deliver to master

如下：我们现在的架构是

6382=>6385 ，6384=>6381 ，6386=>6383

【6.1】60/50 Master/SlaveReadPriority

现在的架构是：

6382=>6385 ，6384=>6381 ，6386=>6383

6350中，只有Ping

如上图，我们发现，发送了5次 a，5次 a 全在主库 6382；所以证明我们之前 60/50 的结论是正确的；

那么我们之前全是这种模式，就不做故障转移测试了，可以直接得出结论了；

结论：

所有的请求，都会发送给主库；

当主库宕机，故障转移期间，读操作会发送给从库；（也会尝试连接主库，连几次无果到阈值后读请求发送到从库）

新主库产生后，所有的请求发给新主库；

【6.2】60/0 Master/SlaveReadPriority

修改 cluster.conf 参数

MasterReadPriority 60

StaticSlaveReadPriority 0

DynamicSlaveReadPriority 0

重启：

现在的架构是：

6382=>6385 ，6384=>6381 ，6386=>6383

关闭 6382主库:

redis-cli -h 192.168.191.176 -p 6382 -a 123456 shutdown

如下：

我们发现故障转移期间，无法访问 a；等故障转移完毕，从库变成主库，就可以访问了；

结论：

所有的请求，都会发送给主库；

当主库宕机，故障转移期间，所有请求都会失败；

新主库产生后，所有的请求发给新主库；

【6.3】50/50

现在的架构是：

6382=>6385 ，6384=>6381 ，6386=>6383

如上面3个图，我们发现真的 50 50 读负载均衡了；

关闭 6382主库:

redis-cli -h 192.168.191.176 -p 6382 -a 123456 shutdown

如上图，我们可以发现，关闭 6382 主库之后，没有任何影响，之前在故障转移切换瞬间失败了一次；

如下图，关闭 6382 ，命令一发起它就收不到任何请求了；

如下图：6385实例的监控，我们发现主库挂了，从库还没有故障转移切换成主库时，read操作依然请求过来了；

结论：

读请求平均分发给所有的主从；

当主库宕机，故障转移期间，读请求都会平均分配到剩余存活的slave；

新主库产生后，读请求平均分发给所有的主从；

后面2个就不测了，知道它有效就行，先这样；

posted @ 2021-08-31 15:25 郭大侠1 阅读(2014) 评论(0) 收藏举报

刷新页面返回顶部

redis代理对比，redis架构对比，redis predixy安装和功能测试

【0】代理功能与性能对比

【1】predixy的安装和配置

【1.1】基本介绍

【1.2】特性、优点

【2】安装

【2.1】下载解压

【2.2】修改配置文件 cluster.conf

【2.3】集群自动发现

【2.4】配置 predixy.conf

【2.5】启动predixy

【3】连接核验

【4】故障转移测试

【4.1】关闭一个主库

【4.2】下掉一个从节点

【4.3】关闭没有从库的主库（彻底关闭一对主从）

【4.4】代理下的集群参数测试，非全slot 可用性

【5】集群水平扩展、收缩测试

【5.1】新增主节点

【5.2】新增从节点

【5.3】删除一主一从，缩容

【5.4】代理因为删除节点报错问题解决：重启代理

【6】读写分离与读负载均衡的测试

【6.1】60/50 Master/SlaveReadPriority

【6.2】60/0 Master/SlaveReadPriority

【6.3】50/50

公告