Beanstalkd 的理解
Beanstalkd 的理解
Beanstalkd 是一个轻量级的内存型队列,利用了和Memcache 类似的协议。其官网beanstakkd官网 下方的感谢语说:
Many thanks to memcached for providing inspiration for simple protocol design and for the structure of the documentation. Not to mention a fantastic piece of software!
对于其底层协议感兴趣的可以去github上看,介绍的很清楚。本文只对beanstalkd 的应用提供思路上的阐释,不列举具体的代码。直到beanstalkd 能够干什么,才能够再实践中去应用。但是怎么用beanstalkd 干活解决问题,则要去网上看beanstalkd 的API,每种语言的都有,可以各取所需。
Beanstalkd 的意思是魔豆,他的队列管理器叫做tube。一般的队列都是先进先出,适合N:M 的生产者消费者处理模型。想象一下如下的模型:我们的业务中经常需要适应高并发的场景,当1万个用户同时访问某个接口时,为了响应服务,我们需要尽可能的加速接口的响应效率。有时候我们只负责提交任务,而不关注任务是否处理成功或者失败。这时候使用过程化的思路解决问题,就会受到牵制。假若盲目的增加机器,压榨mysql的性能,还是不能阻挡十万、百万并发。这时候可以考虑使用异步去处理,接口收到请求之后,立刻将任务放进队列里,新启一台脚本机,起若干进程来消费任务。
为什么要使用Beanstalkd
实际业务中,有时候会出现队列与队列之间相互依赖的情况。比如A,B两个队列。A负责往数据库中insert数据,而B队列负责update数据。只有插入数据库后,我们才能进行update。但是如果同时开两个队列。因为队列执行的先后是不可控的,这就造成了B update的时候,不知道A是否已经insert。另外比如Reids的队列机制,一但消费者从队列中取出了一个job。但是由于神奇的原因,失败掉了,怎么办?任务就这样丢失了,这个任务再也处理不掉了。
带着这些问题,我们交给BeansTalkd来解决。
理解Beanstalkd的队列机制
Beanstalkd 是CS结构,有Server端和Client段之分。Server端都是一样的,负责存储和消费队列任务。但是Client端由于各种语言各种框架,就各部相同。
任务在队里之中被称作Job. 一个Job 再Beanstalkd中有以下的生命周期:
- put:将一个任务放置进tube中
- deayed: 这个任务现在再等待中,需要若干秒才能准备完毕【延迟队列】
- ready: 这个任务已经准备好了,可以消费了。所有的消费都是要从取ready状态的job
- reserved: 这个任务已经被消费者消费。
- release: 这个job执行失败了,把它放进ready状态队列中。让其他队列执行。
- bury:这个job执行失败了,但不希望其他队列执行,先把它埋起来。
这是一个job生命周期的主要状态,如果有讲的不全的,可以去翻看API.
各种语言的演示代码都大同小异,这里就不浪费纸张了。