赵鹏城 Zpc Blog 技术也是一种艺术形式

分布式 hadoop 中文分词系统 web后台架构 | 如果是为了谋生,那一个人只有去索取;但如果是为了生活,一个人必须要去奉献。

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

  为了便于管理词库及分词算法,我设计了一个分词管理系统。

  系统具备完整的工程逻辑,从生成词库到分词服务,再到一个自我测试模块。

  根据测试结果,还可以对词库进行修正,使系统具有了自我扩充能力。

 

系统架构图如下:

posted on 2010-01-22 15:45  leon_zhao  阅读(2969)  评论(9编辑  收藏  举报