redis使用场景和监控指标
一、redis的典型使用场景
1、缓存
缓存现在几乎是所有中大型网站都在用的必杀技,合理的利用缓存不仅能够提升网站访问速度,还能大大降低数据库的压力。Redis提供了键过期功能,也提供了灵活的键淘汰策略,所以,现在Redis用在缓存的场合非常多。(推荐:《Redis视频教程》)
2、排行榜
很多网站都有排行榜应用的,如京东的月度销量榜单、商品按时间的上新排行榜等。Redis提供的有序集合数据类构能实现各种复杂的排行榜应用。
3、计数器
什么是计数器,如电商网站商品的浏览量、视频网站视频的播放数等。为了保证数据实时效,每次浏览都得给+1,并发量高时如果每次都请求数据库操作无疑是种挑战和压力。Redis提供的incr命令来实现计数器功能,内存操作,性能非常好,非常适用于这些计数场景。
4、分布式会话
集群模式下,在应用不多的情况下一般使用容器自带的session复制功能就能满足,当应用增多相对复杂的系统中,一般都会搭建以Redis等内存数据库为中心的session服务,session不再由容器管理,而是由session服务及内存数据库管理。
5、分布式锁
在很多互联网公司中都使用了分布式技术,分布式技术带来的技术挑战是对同一个资源的并发访问,如全局ID、减库存、秒杀等场景,并发量不大的场景可以使用数据库的悲观锁、乐观锁来实现,但在并发量高的场合中,利用数据库锁来控制资源的并发访问是不太理想的,大大影响了数据库的性能。可以利用Redis的setnx功能来编写分布式的锁,如果设置返回1说明获取锁成功,否则获取锁失败,实际应用中要考虑的细节要更多。
6、 社交网络
点赞、踩、关注/被关注、共同好友等是社交网站的基本功能,社交网站的访问量通常来说比较大,而且传统的关系数据库类型不适合存储这种类型的数据,Redis提供的哈希、集合等数据结构能很方便的的实现这些功能。
7、最新列表
Redis列表结构,LPUSH可以在列表头部插入一个内容ID作为关键字,LTRIM可用来限制列表的数量,这样列表永远为N个ID,无需查询最新的列表,直接根据ID去到对应的内容页即可。
8、消息系统
消息队列是大型网站必用中间件,如ActiveMQ、RabbitMQ、Kafka等流行的消息队列中间件,主要用于业务解耦、流量削峰及异步处理实时性低的业务。Redis提供了发布/订阅及阻塞队列功能,能实现一个简单的消息队列系统。另外,这个不能和专业的消息中间件相比。
二、监控指标
•性能指标:Performance
•内存指标: Memory
•基本活动指标:Basic activity
•持久性指标: Persistence
•错误指标:Error
性能指标:Performance
name | Description |
latency | Redis响应一个请求的时间 |
instantaneous_ops_per_sec | 平均每秒处理请求总数 |
hi rate(calculated) | 缓存命中率(计算出来的 |
内存指标: Memory
name |
Description |
used_memory | 已使用内存 |
mem_fragmentation_ratio | 内存碎片率 |
evicted_keys | 由于最大内存限制被移除的key的数量 |
blocked_clients | 由于BLPOP,BRPOP,or BRPOPLPUSH而被阻塞的客户端 |
基本活动指标:Basic activity
Name | Description |
connected_clients | 客户端连接数 |
conected_laves | slave数量 |
master_last_io_seconds_ago | 最近一次主从交互之后的秒数 |
keyspace | 数据库中的key值总数 |
持久性指标: Persistence
Name | Description |
rdb_last_save_time | 最后一次持久化保存磁盘的时间戳 |
rdb_changes_sice_last_save |
自最后一次持久化以来数据库的更改数 |
错误指标:Error
Name | Description |
rejected_connections | 由于达到maxclient限制而被拒绝的连接数 |
keyspace_misses | key值查找失败(没有命中)次数 |
master_link_down_since_seconds | 主从断开的持续时间(以秒为单位) |
监控方式
•redis-benchmark •redis-stat •redis-faina •redislive •redis-cli •monitor •showlog
1.get:获取慢查询日志
2.len:获取慢查询日志条目数
3.reset:重置慢查询日志
相关配置:
slowlog-log-slower-than 1000 # 设置慢查询的时间下线,单位:微秒 slowlog-max-len 100 # 设置慢查询命令对应的日志显示长度,单位:命令数
info(可以一次性获取所有的信息,也可以按块获取信息)
1.server:服务器运行的环境参数
2.clients:客户端相关信息
3.memory:服务器运行内存统计数据
4.persistence:持久化信息
5.stats:通用统计数据
6.Replication:主从复制相关信息
7.CPU:CPU使用情况
8.cluster:集群信息
9.Keypass:键值对统计数量信息
终端info命令使用
./redis-cli info 按块获取信息 | grep 需要过滤的参数 ./redis-cli info stats | grep ops
交互式info命令使用
#./redis-cli > info server
性能监控:
redis-cli info | grep ops # 每秒操作数
内存监控
[root@CombCloud-2020110836 src]# ./redis-cli info | grep used | grep human used_memory_human:2.99M # 内存分配器从操作系统分配的内存总量 used_memory_rss_human:8.04M #操作系统看到的内存占用,top命令看到的内存 used_memory_peak_human:7.77M # redis内存消耗的峰值 used_memory_lua_human:37.00K # lua脚本引擎占用的内存大小
由于BLPOP,BRPOP,or BRPOPLPUSH而被阻塞的客户端
[root@CombCloud-2020110836 src]# ./redis-cli info | grep blocked_clients blocked_clients:0
由于最大内存限制被移除的key的数量
[root@CombCloud-2020110836 src]# ./redis-cli info | grep evicted_keys evicted_keys:0 #
内存碎片率
[root@CombCloud-2020110836 src]# ./redis-cli info | grep mem_fragmentation_ratio mem_fragmentation_ratio:2.74
已使用内存
[root@CombCloud-2020110836 src]# ./redis-cli info | grep used_memory: used_memory:3133624
基本活动指标:
redis连接了多少客户端 通过观察其数量可以确认是否存在意料之外的连接。如果发现数量不对劲,就可以使用lcient list指令列出所有的客户端链接地址来确定源头。
[root@CombCloud-2020110836 src]# ./redis-cli info | grep connected_clients connected_clients:1
[root@CombCloud-2020110836 src]# ./redis-cli info | grep connected
connected_clients:1 # 客户端连接数量
connected_slaves:1 # slave连接数量
持久性指标:
[root@CombCloud-2020110836 src]# ./redis-cli info | grep rdb_last_save_time rdb_last_save_time:1591876204 # 最后一次持久化保存磁盘的时间戳 [root@CombCloud-2020110836 src]# ./redis-cli info | grep rdb_changes_since_last_save rdb_changes_since_last_save:0 # 自最后一次持久化以来数据库的更改数
错误指标
由于超出最大连接数限制而被拒绝的客户端连接次数,如果这个数字很大,则意味着服务器的最大连接数设置得过低,需要调整maxclients
[root@CombCloud-2020110836 src]# ./redis-cli info | grep connected_clients connected_clients:1
key值查找失败(没有命中)次数,出现多次可能是被hei ke gongjji
[root@CombCloud-2020110836 src]# ./redis-cli info | grep keyspace keyspace_misses:0
主从断开的持续时间(以秒为单位)
[root@CombCloud-2020110836 src]# ./redis-cli info | grep rdb_changes_since_last_save rdb_changes_since_last_save:0
复制积压缓冲区如果设置得太小,会导致里面的指令被覆盖掉找不到偏移量,从而触发全量同步
[root@CombCloud-2020110836 src]# ./redis-cli info | grep backlog_size repl_backlog_size:1048576
通过查看sync_partial_err变量的次数来决定是否需要扩大积压缓冲区,它表示主从半同步复制失败的次数
[root@CombCloud-2020110836 src]# ./redis-cli info | grep sync_partial_err sync_partial_err:1
redis性能测试命令
./redis-benchmark -c 100 -n 5000
说明:100个连接,5000次请求对应的性能
https://mp.weixin.qq.com/s/miXnInM25bi5Zq-_4RkSdA
zabbix 监控redis python3脚本
https://www.cnblogs.com/sunkedong/p/7580834.html zabbix采用python脚本监控reids