搜索引擎思路

  

  1)webclient 读取网页

  2)将读取的内容分词(盘古分词)

  3)得到分词后的网页索引进Lucene

  4)通过索引读取存入的网页数据

 

posted on 2010-06-29 17:14  Master zhu  阅读(143)  评论(0编辑  收藏  举报

导航