分布式 hadoop 中文分词系统 web后台架构 | 如果是为了谋生,那一个人只有去索取;但如果是为了生活,一个人必须要去奉献。
为了便于管理词库及分词算法,我设计了一个分词管理系统。
系统具备完整的工程逻辑,从生成词库到分词服务,再到一个自我测试模块。
根据测试结果,还可以对词库进行修正,使系统具有了自我扩充能力。
系统架构图如下: