smhy8187

 

千万级数据的分类搜索引擎(一) 收藏

 

千万级数据的分类搜索引擎(一) 收藏
     这套分类搜索引擎花了我2年的时间,经历过好几次的版本升级,终于完成了分布式的版本,实际运营接近一年,相当稳定,系统最高容量达到1300W数据,单机支撑800W左右的商品,单机吞吐超过30个/秒,系统可平行扩展,本周就扩容了一次。下面逐步说明这套系统的架构。

一、搜索引擎的整体架构

 http://blog.csdn.net/mchman/archive/2007/07/27/1710650.aspx

 系统包含以下部分:

(1)轻量级WebServer:自己写的一个WebServer,高性能,大并发,自带WebCache模块,和一个单独的业务进程通过消息队列通信

(2)通用服务器:一个高性能的中转服务器,使用epoll模型,前端和WebServe用短tcp连接通信,后端和搜索引擎服务器用TCP长连接通信,自己管理一个连接池,双击热备

(3)分类搜索引擎:采用分布式架构,每个集群负责处理部分数据的浏览请求,集群之间互相备份,共同分担查询请求

(4)数据库服务器:作为一个流水DB,只记录商品的更新,删除操作,在搜索引擎取完数据后,即清空数据库表。

下一篇文章就逐一介绍这些模块。

 

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/mchman/archive/2007/07/27/1710650.aspx

 

posted on 2009-07-21 09:29  new2008  阅读(317)  评论(0编辑  收藏  举报

导航