Redis哨兵机制
一 主从复制高可用
#主从复制存在的问题:
#1 主从复制,主节点发生故障,需要做故障转移,可以手动转移:让其中一个slave变成master
#2 主从复制,只能主写数据,所以写能力和存储能力有限
二 架构说明
可以做故障判断,故障转移,通知客户端(其实是一个进程),客户端直接连接sentinel的地址
1 多个sentinel发现并确认master有问题
2 选举触一个sentinel作为领导
3 选取一个slave作为新的master
4 通知其余slave成为新的master的slave
5 通知客户端主从变化
6 等待老的master复活成为新master的slave
三 安装配置
1 配置开启主从节点
2 配置开启sentinel监控主节点(sentinel是特殊的redis)
3 应该是多台机器
#配置开启sentinel监控主节点
mkdir -p redis4/conf redis4/data redis5/conf redis5/data redis6/data redis6/conf
vi sentinel.conf
port 26379
daemonize yes
dir ./data
protected-mode no
bind 0.0.0.0
logfile "redis_sentinel_26379.log"
sentinel monitor mymaster 127.0.0.1 6379 2
sentinel down-after-milliseconds mymaster 30000
sentinel parallel-syncs mymaster 1
sentinel failover-timeout mymaster 180000
docker run -p 26379:26379 --name redis_26379 -v /home/redis4/conf/sentinel.conf:/etc/redis/sentinel.conf -v /home/redis4/data:/data -d redis redis-sentinel /etc/redis/sentinel.conf
docker run -p 26378:26379 --name redis_26378 -v /home/redis5/conf/sentinel.conf:/etc/redis/sentinel.conf -v /home/redis5/data:/data -d redis redis-sentinel /etc/redis/sentinel.conf
docker run -p 26377:26379 --name redis_26377 -v /home/redis6/conf/sentinel.conf:/etc/redis/sentinel.conf -v /home/redis6/data:/data -d redis redis-sentinel /etc/redis/sentinel.conf
redis-sentinel sentinel.conf
info
配置会重写,自动发现slave
sentinel monitor mymaster 127.0.0.1 6379 2
sentinel down-after-milliseconds mymaster 30000
sentinel parallel-syncs mymaster 1
sentinel failover-timeout mymaster 180000
sentinel monitor <master-name> <ip> <redis-port> <quorum>
告诉sentinel去监听地址为ip:port的一个master,这里的master-name可以自定义,quorum是一个数字,指明当有多少个sentinel认为一个master失效时,master才算真正失效
sentinel auth-pass <master-name> <password>
设置连接master和slave时的密码,注意的是sentinel不能分别为master和slave设置不同的密码,因此master和slave的密码应该设置相同。
sentinel down-after-milliseconds <master-name> <milliseconds>
这个配置项指定了需要多少失效时间,一个master才会被这个sentinel主观地认为是不可用的。 单位是毫秒,默认为30秒
sentinel parallel-syncs <master-name> <numslaves>
这个配置项指定了在发生failover主备切换时最多可以有多少个slave同时对新的master进行 同步,这个数字越小,完成failover所需的时间就越长,但是如果这个数字越大,就意味着越 多的slave因为replication而不可用。可以通过将这个值设为 1 来保证每次只有一个slave 处于不能处理命令请求的状态。
sentinel failover-timeout <master-name> <milliseconds>
failover-timeout 可以用在以下这些方面:
1. 同一个sentinel对同一个master两次failover之间的间隔时间。
2. 当一个slave从一个错误的master那里同步数据开始计算时间。直到slave被纠正为向正确的master那里同步数据时。
3.当想要取消一个正在进行的failover所需要的时间。
4.当进行failover时,配置所有slaves指向新的master所需的最大时间。不过,即使过了这个超时,slaves依然会被正确配置为指向master,但是就不按parallel-syncs所配置的规则来了。
四、一主两从和哨兵搭建
1 搭一个一主两从
#创建三个配置文件:
#第一个是主配置文件 /soft/redis/redis.conf_back
daemonize yes
pidfile "/var/run/redis.pid"
port 6379
dir "/opt/soft/redis/data"
logfile "6379.log"
bind 0.0.0.0
protected-mode no
appendonly yes
appendfilename "appendonly.aof"
appendfsync everysec
no-appendfsync-on-rewrite yes
#第二个是从配置文件 /soft/redis/re_slave1.conf
daemonize yes
pidfile "/var/run/redis.pid"
port 6378
dir "/opt/soft/redis/slave1_data"
logfile "6378.log"
bind 0.0.0.0
protected-mode no
slaveof 127.0.0.1 6379 # 如果是集群,换成公网IPd
slave-read-only yes
#第三个是从配置文件 /soft/redis/re_slave2.conf
daemonize yes
pidfile "/var/run/redis.pid"
port 6377
dir "/opt/soft/redis/slave1_data"
logfile "6377.log"
bind 0.0.0.0
protected-mode no
slaveof 127.0.0.1 6379 # 如果是集群,换成公网IP
slave-read-only yes
#把三个redis服务都启动起来
./src/redis-server redis_6379.conf
./src/redis-server redis_6378.conf
./src/redis-server redis_6377.conf
2 搭建哨兵
# sentinel.conf这个文件
# 把哨兵也当成一个redis服务器
创建三个配置文件分别叫sentinel.conf_back sentinel_6378.conf sentinel_6377.conf
# 在"/opt/soft/redis/"路径下分别创建 data slave1_data slave2_data 文件夹
#哨兵配置文件内容如下:(需要修改端口,文件地址和日志文件名字即可)
port 26379
daemonize yes
dir "/opt/soft/redis/data" # 修改哨兵对应的日志文件存放的文件夹 slave1_data slave2_data
protected-mode no
bind 0.0.0.0
logfile "redis_sentinel_26379.log" # 不同的哨兵日志修改名称 在对应的哨兵日志文件夹生成我们这个命名的日志文件
sentinel monitor mymaster 39.99.228.188 6379 2 # 一定要写成公网IP,不然我们的程序连不上
sentinel down-after-milliseconds mymaster 30000
sentinel parallel-syncs mymaster 1
sentinel failover-timeout mymaster 180000
#启动三个哨兵
./src/redis-sentinel sentinel.conf_back
./src/redis-sentinel sentinel_6378.conf
./src/redis-sentinel sentinel_6377.conf
# 登陆哨兵
./src/redis-cli -p 26377
# 输入 info
'''
[root@sahala redis]# ps -ef | grep sentinel
root 20794 1 0 03:43 ? 00:00:00 redis-sentinel 0.0.0.0:26379 [sentinel]
root 21267 1 0 03:44 ? 00:00:00 redis-sentinel 0.0.0.0:26378 [sentinel]
root 23659 1 0 03:45 ? 00:00:00 redis-sentinel 0.0.0.0:26377 [sentinel]
root 23952 20669 0 03:45 pts/0 00:00:00 grep --color=auto sentinel
[root@sahala redis]# redis-cli -p 26379
127.0.0.1:26379> keys *
(error) ERR unknown command `keys`, with args beginning with: `*`,
127.0.0.1:26379> info
# Server
redis_version:5.0.7
redis_git_sha1:00000000
redis_git_dirty:0
redis_build_id:2e580b6b3c408211
redis_mode:sentinel
os:Linux 3.10.0-1062.18.1.el7.x86_64 x86_64
arch_bits:64
multiplexing_api:epoll
atomicvar_api:atomic-builtin
gcc_version:4.8.5
process_id:20794
run_id:9f2bae81b053c14644c508917a59572950bbdd56
tcp_port:26379
uptime_in_seconds:113
uptime_in_days:0
hz:13
configured_hz:10
lru_clock:1179623
executable:/soft/redis-5.0.7/redis-sentinel
config_file:/soft/redis-5.0.7/sentinel.conf_back
# Clients
connected_clients:3
client_recent_max_input_buffer:2
client_recent_max_output_buffer:0
blocked_clients:0
# CPU
used_cpu_sys:0.074164
used_cpu_user:0.108804
used_cpu_sys_children:0.000000
used_cpu_user_children:0.000000
# Stats
total_connections_received:76
total_commands_processed:241
instantaneous_ops_per_sec:1
total_net_input_bytes:10006
total_net_output_bytes:1579
instantaneous_input_kbps:0.02
instantaneous_output_kbps:0.01
rejected_connections:0
sync_full:0
sync_partial_ok:0
sync_partial_err:0
expired_keys:0
expired_stale_perc:0.00
expired_time_cap_reached_count:0
evicted_keys:0
keyspace_hits:0
keyspace_misses:0
pubsub_channels:0
pubsub_patterns:0
latest_fork_usec:0
migrate_cached_sockets:0
slave_expires_tracked_keys:0
active_defrag_hits:0
active_defrag_misses:0
active_defrag_key_hits:0
active_defrag_key_misses:0
# Sentinel
sentinel_masters:1
sentinel_tilt:0
sentinel_running_scripts:0
sentinel_scripts_queue_length:0
sentinel_simulate_failure_flags:0
master0:name=mymaster,status=ok,address=127.0.0.1:6379,slaves=2,sentinels=3 # 6379 是主redis
127.0.0.1:26379>
'''
#等待原来的主库启动,该主库会变成从库
主动停掉主redis 6379,哨兵会自动选择一个从库作为主库
127.0.0.1:6379 > redis-cli -p 6379
127.0.0.1:6379 > shutdown
'''
127.0.0.1:26379> info
# Server
redis_version:5.0.7
redis_git_sha1:00000000
redis_git_dirty:0
redis_build_id:2e580b6b3c408211
redis_mode:sentinel
os:Linux 3.10.0-1062.18.1.el7.x86_64 x86_64
arch_bits:64
multiplexing_api:epoll
atomicvar_api:atomic-builtin
gcc_version:4.8.5
process_id:20794
run_id:9f2bae81b053c14644c508917a59572950bbdd56
tcp_port:26379
uptime_in_seconds:614
uptime_in_days:0
hz:11
configured_hz:10
lru_clock:1180124
executable:/soft/redis-5.0.7/redis-sentinel
config_file:/soft/redis-5.0.7/sentinel.conf_back
# Clients
connected_clients:3
client_recent_max_input_buffer:2
client_recent_max_output_buffer:0
blocked_clients:0
# CPU
used_cpu_sys:0.679408
used_cpu_user:1.087880
used_cpu_sys_children:0.000000
used_cpu_user_children:0.000000
# Stats
total_connections_received:997
total_commands_processed:2501
instantaneous_ops_per_sec:4
total_net_input_bytes:85254
total_net_output_bytes:17205
instantaneous_input_kbps:0.22
instantaneous_output_kbps:0.04
rejected_connections:0
sync_full:0
sync_partial_ok:0
sync_partial_err:0
expired_keys:0
expired_stale_perc:0.00
expired_time_cap_reached_count:0
evicted_keys:0
keyspace_hits:0
keyspace_misses:0
pubsub_channels:0
pubsub_patterns:0
latest_fork_usec:0
migrate_cached_sockets:0
slave_expires_tracked_keys:0
active_defrag_hits:0
active_defrag_misses:0
active_defrag_key_hits:0
active_defrag_key_misses:0
# Sentinel
sentinel_masters:1
sentinel_tilt:0
sentinel_running_scripts:0
sentinel_scripts_queue_length:0
sentinel_simulate_failure_flags:0
master0:name=mymaster,status=ok,address=127.0.0.1:6377,slaves=4,sentinels=3 # 发现哨兵将6377选为主redis
'''
手动启动redis 6379服务端,模拟故障恢复。恢复后6379只能作为新主redis 6377的从库了。
五、 客户端连接
# 哨兵的配置文件这一项要配成公网地址
# sentinel monitor mymaster 39.99.228.188 6379 2
import redis
from redis.sentinel import Sentinel
# 连接哨兵服务器(主机名也可以用域名)
# 39.99.228.188: 26379
sentinel = Sentinel([('39.99.228.188', 26379),
('39.99.228.188', 26378),
('39.99.228.188', 26377)
],
socket_timeout=5)
print(sentinel) # Sentinel<sentinels=[39.99.228.188:26379,39.99.228.188:26378,39.99.228.188:26377]>
# 获取主服务器地址
master = sentinel.discover_master('mymaster')
print(master) # ('39.99.228.188', 6379)
# 获取从服务器地址
slave = sentinel.discover_slaves('mymaster')
print(slave)
'''
[('127.0.0.1', 6378),
('39.99.228.188', 6377),
('39.99.228.188', 6378),
('127.0.0.1', 6377)]
'''
# 获取主服务器进行写入
master = sentinel.master_for('mymaster', socket_timeout=5)
w_ret = master.set('addss', '安徽/阜阳')
slave = sentinel.slave_for('mymaster', socket_timeout=5)
r_ret = slave.get('addss').decode('utf8')
print(r_ret) # 安徽/阜阳