【转载】Redis的一些使用场景
看了一些文章,关于Redis的使用场景,觉得挺好的。Redis肯定远远不止作为缓存而使用。Redis更像是一个实现很好的数据结构服务器,通过TCP栈协议提供服务。下面进行详细描述。
http://database.51cto.com/art/201107/276333.htm
(其实是对 http://oldblog.antirez.com/post/take-advantage-of-redis-adding-it-to-your-stack.html
以及这篇 http://highscalability.com/blog/2011/7/6/11-common-web-use-cases-solved-in-redis.html 的翻译和补充)
显示最新的项目列表
下面这个语句常用来显示最新项目,随着数据多了,查询毫无疑问会越来越慢。
SELECT * FROM foo WHERE ... ORDER BY time DESC LIMIT 10
在Web应用中,“列出最新的回复”之类的查询非常普遍。
因为项目本来就是按这个顺序被创建的,但要输出这个顺序却不得不进行排序操作。
类似的问题就可以用Redis来解决。比如说,我们的一个Web应用想要列出用户贴出的最新20条评论。在最新的评论边上我们有一个“显示全部”的链接,点击后就可以获得更多的评论。
我们假设数据库中的每条评论都有一个唯一的递增的ID字段。 -每次新评论发表时,我们会将它的ID添加到一个Redis列表: LPUSH latest.comments <ID> -我们将列表裁剪为指定长度,因此Redis只需要保存最新的5000条评论: LTRIM latest.comments 0 5000 FUNCTION get_latest_comments(start,num_items): id_list = redis.lrange('latest.comments',start,start+num_items-1) IF id_list.length < num_items id_list = SQL_DB('SELECT ... ORDER BY time LIMIT ...';) END RETURN id_list END
SQL数据库(或是硬盘上的其他类型数据库)只是在用户需要获取“很远”的数据时才会被触发,而主页或第一个评论页是不会麻烦到硬盘上的数据库了。
删除与过滤
我们可以使用LREM来删除评论。
可以给列表使用过滤器来处理(过滤器/scan查看这篇文章 link )。也可以针对每种不同情况使用不同的列表。因为Redis处理速度很快。
排行榜相关
在按得分排序以及实时更新这些几乎每秒钟都需要更新的功能上数据库的性能不够理想。
典型的比如那些在线游戏的排行榜,比如一个Facebook的游戏,根据得分你通常想要: -列出前100名高分选手 -列出某用户当前的全球排名 这些操作对于Redis来说小菜一碟,即使你有几百万个用户,每分钟都会有几百万个新的得分。
模式是这样的,每次获得新得分时,我们用这样的代码:
ZADD leaderboard <score> <username> 得到前100名高分用户很简单:ZREVRANGE leaderboard 0 99。 用户的全球排名也相似,只需要:ZRANK leaderboard <username>。 以上的username 也可以用userid 来替换以更具扩展性。
按照用户投票和时间排序
排行榜的一种常见变体模式就像Reddit或Hacker News用的那样,新闻按照类似下面的公式根据得分来排序:
score = points / time^alpha
这种模式很有趣。因此用户的投票会相应的把新闻挖出来,但时间会按照一定的指数将新闻埋下去。下面是我们的模式,当然算法由你决定。
模式是这样的,开始时先观察那些可能是最新的项目,例如首页上的1000条新闻都是候选者,因此我们先忽视掉其他的,这实现起来很简单。 - 每次新的新闻贴上来后,我们将ID添加到列表中,使用LPUSH + LTRIM,确保只取出最新的1000条项目。 - 有一项后台任务获取这个列表,并且持续的计算这1000条新闻中每条新闻的最终得分。计算结果由ZADD命令按照新的顺序填充生成列表,老新闻则被清除。 这里的关键思路是排序工作是由后台任务来完成的。
过期项目处理
另一种常用的项目排序是按照时间排序。我们使用unix时间作为得分即可。模式如下:
- 每次有新项目添加到我们的非Redis数据库时,我们把它加入到排序集合中。这时我们用的是时间属性,current_time和time_to_live。
- 另一项后台任务使用ZRANGE…SCORES查询排序集合,取出最新的10个项目。如果发现unix时间已经过期,则在数据库中删除条目。
计数
有了原子递增(atomic increment),你可以放心的加上各种计数,用GETSET重置,或者是让它们过期。
INCR user:<id> EXPIRE user:<id> 60 或者 GETSET user:<id> 0
这样当60秒内用户访问密集到达多少次数之后,就会触发一定的事件,比如blocking,或者弹窗提醒等。
特定时间内的特定项目
另一项对于其他数据库很难,但Redis做起来却轻而易举的事就是统计在某段特点时间里有多少特定用户访问了某个特定资源。
比如我想要知道某些特定的注册用户或IP地址,他们到底有多少访问了某篇文章。
每次我获得一次新的页面浏览时我只需要这样做: SADD page:day1:<page_id> <user_id> 当然你可能想用unix时间替换day1,比如time()-time()%(3600*24)等等。 想知道特定用户的数量吗?只需要使用SCARD page:day1:<page_id>。 需要测试某个特定用户是否访问了这个页面?SISMEMBER page:day1:<page_id>。
实时分析正在发生的情况,用于数据统计与防止垃圾邮件等
上面提到的Redis原语比如 zrange 等很适合做实时分析。当然也可以与其他系统比如 Flume、Storm 进行结合。有时间可以看看下面这篇文章:
http://blog.csdn.net/ymh198816/article/details/51998085 《Flume+Kafka+Storm+Redis实时分析系统基本架构》
Pub/Sub
Redis其实也支持MQ操作。
运行稳定并且快速。支持模式匹配,能够实时订阅与取消频道。using commands likeSUBSCRIBE, UNSUBSCRIBE, and PUBLISH.
队列
已经注意到像list push和list pop这样的Redis命令能够很方便的执行队列操作了。
但能做的可不止这些:比如Redis还有list pop的变体命令(blpop, blocking queue),能够在列表为空时阻塞队列。
Can also do interesting things implement a rotating queue of RSS feeds to update.
缓存
让你的缓存从只能存储数据变得能够更新数据,因此你不再需要每次都重新生成数据了。
总结
目标是让你的系统变得不再复杂,让你的网站反应更快。
你不需要改变现有的数据库结构,使用Redis给你的框架带来新的东西,来完成那些从前认为不可能做到/很难做到的,或是成本太高的任务。