使用SquirrelMQ打造一个千万级数据更新量的应用

原文:http://blog.sina.com.cn/s/blog_7530db6f0100uo4c.html


    我们知道微博的访问量是非常大的,一秒钟可能有成千上万的人发布微博或者删除微博,所以数据库要承受的压力非常大,这样就可能导致数据库并发量太大而操作失败。


    那么,我们考虑一下,可不可以把所有的插入操作一步一步的完成呢?也就是说等到第一个插入操作完成再做第二个插入操作呢?要实现这种情况,我们可以使用消息队列。消息队列的作用就是把大量并发操作变成线性操作。那么我们怎么使用消息队列来完成呢?如下图:

 

从图上可以看出,我们把所有的数据库操作都发送到消息队列中,然后让消息队列来进行对数据库的操作。因为消息队列是一条一条消息进行的,所以并不会对数据库造成高并发的操作。


一,SquirrelMQ使用

下面,我们介绍使用SquirrelMQ消息队列来完成上面所说的应用吧。

1)  安装Lua。

2)  首先下载编译SquirrelMQ:

#> wget http://squirrel-message-queue.googlecode.com/files/squirrel-with-lua-v1.2.zip

#> tar –zxvf squirrel-with-lua-v1.2.zip

#> cd squirrel-with-lua-v1.2

#> make


2) 修改SquirrelMQ配置(squirrel.conf文件):

# 侦听端口

listingPort 6061


# 最大可以使用内存数(单位:字节)

memoryLimitUsed 524288000


# 多长时间进行存储数据到硬盘(防止down机时数据丢失,单位为秒)

secondsToSaveDisk 30


# 多少次数据变化才进行存储数据到硬盘(防止写数据过于频繁)

chagesToSaveDisk 30


# 客户端连接多长时间不操作自动关闭(单位为秒)

clientExpiredTime 60


# 多长时间运行一次cron(单位为毫秒)

cronLoops 5000


# 是否开启Lua处理线程

enableLuaThread 1


# 是否使用守护进程模式运行

daemonize 0


我们根据自己的需求来修改配置,特别说明一下的是,当开启Lua处理线程时,我们可以编写Lua脚本来处理队列(在cron/main.lua)。这样就可以让服务器本身来处理消息队列的数据,而不用另外写一个cron程序来处理。下面我们会介绍。


3) 运行SquirrelMQ:

#> ./squirrel –c squirrel.conf


二,使用客户端API

SquirrelMQ提供一个PHP访问的API,在php/squirrel.class.php。我们可以使用这个API文件轻松地访问SquirrelMQ。

这个API文件把所有访问SquirrelMQ的操作封装成一个类,叫Squirrel,在使用时直接new一个Squirrel的对象即可,如下:


<?php

include("squirrel.class.php");

$smq = new Squirrel('127.0.0.1', 6061);

$smq->push_tail("INSERT INTO mytable(uid, username, password)VALUES(NULL, 'liexusong', '123456');");

?>

这样,我们就可以把一条消息插入到消息队列了。我们可以使用size()方法来获取SquirrelMQ的消息条数:


<?php

include("squirrel.class.php");

$smq = new Squirrel('127.0.0.1', 6061);

$size = $smq->size();

echo "The SquirrelMQ size: $size";

?>


SquirrelMQ支持的API有:

1)插入到队列的头部:

$smq->push_head($message);


2)插入到队列的尾部:

$smq->push_tail($message);


3)取得队列的第一条消息,并从队列中删除:

$message = $smq->pop_head();


4)取得队列的最后一条消息,并从队列中删除:

$message = $smq->pop_tail();


5)取得队列的第n条消息,并且从队列中删除:

$message = $smq->pop_index($index);


6)取得队列的第一条消息,但不从队列中删除:

$message = $smq->get_head();


7)取得队列的最后一条消息,但不从队列中删除:

$message = $smq->get_tail();


8)取得队列的第n条消息,但不从队列中删除:

$message = $smq->get_index($index);


9)取得队列的大小:

$size = $smq->size();


10)取得队列的状态:

$stat = $smq->stat();


三,使用Lua处理队列

SquirrelMQ的一个令人兴奋的特性就是支持使用Lua处理队列中的消息,下面我们来介绍一下这个功能。

要 开启Lua处理线程,需要在配置文件中把enableLuaThread设置为1。这样SquirrelMQ就会开启Lua处理线程。我们可以在 cron/main.lua文件中编写我们的Lua代码来处理队列中的消息。在cron/main.lua文件中,必须编写一个__main__的函 数,SquirrelMQ就是以这个函数作为入口,如:


function __main__()

......

end




在__main__函数中,我们可以使用一些SquirrelMQ提供的API函数取得队列中的消息,如smq_pop_head()和smq_pop_tail()等。__main__函数可以这样写:


require "luasql.mysql"


function __main__()

    env = luasql.mysql()

    con = env:connect("database", "username", "password", "127.0.0.1", 3306)


    while true do

       local ok, sql = smq_pop_head()

       if ok then

           res = con:execute(sql)

       end

    end


    con:close()

    env:close()

end


记住,SquirrelMQ提供的API都是阻塞的,也就是说,当队列为空时,API会阻塞知道队列有消息可以获取为止,这样做的目的是为了尽量减少Lua线程的运行时间。

在上面例子中,我们使用smq_pop_head()来取得队列的第一条消息,然后执行此消息(con:execute(sql))。


SquirrelMQ提供给Lua线程使用的API有:

*         ok, item = smq_pop_head()

*         ok, item = smq_pop_tail()

*         ok, item = smq_pop_index()

*         ok, item = smq_get_head()

*         ok, item = smq_get_tail()

*         ok, item = smq_get_index()

*         size = smq_queue_size()

*         ok = smq_push_head(item)

*         ok = smq_push_tail(item)


上面的API对应PHP客户端的API。


介绍完 SquirrelMQ的使用,你可能会觉得这样做会不利于MySQL的并发处理。的确,如果你只搭建一台消息队列服务器的话会有这种情况,但是,如果你搭 建了100或者1000台消息队列服务器,然后把所有的请求均匀地分发到每台服务器上,在通过消息队列服务器并发对MySQL进行操作。


我们除了可以使用消息队列来减轻对数据库的压力之外,还可以做很多类似的事情,例如一个网站实时生成图片缩略图(如facebook),那么就可以把生成缩略图的操作存入到消息队列,然后让消息队列一个个处理。


另外SquirrelMQ的效率比Redis要高,而且内存碎片比Redis要少。

posted on 2012-02-04 13:30  cn三少<script></script>  阅读(485)  评论(0编辑  收藏  举报

导航