我的小型网站搜索分词中遇到的问题

     本人从事网站开发工作4年多了,但是一直对网站的搜索分词感觉非常难以实现,尤其是对于一个小型网站来说更是个让人头疼的问题。
     经过几天的努力奋斗实现的一些简单的分词处理:比如现在可以把400电话申请分成400电话和申请两个词,然后再用这两个词去数据库查符合条件的记录,
     测试地址1:http://blog.my400800.cn/400电话申请   ,如果你打开上面的地址,你可以发现单个的400电话或申请关键词都会被标红,即便是申请400电话这样的关键词也会被标红。


     测试地址2:    http://blog.my400800.cn/400电话800电话对比
          这个可以把 400电话800电话对比 拆分成   400电话 800电话 对比   三个关键词。

     但是在这个分词中存在一个极大的问题,
 1、就是无法将和搜索内容相关度高的内容排在搜索结果的前面。
 2、在取得搜索结果的摘要的时候无法取得包含关键词密度最多的或和搜索关键词相关度最高的内容。
上面这两个问题我想的好久也没想到一个比较好的解决方案,希望这方面的前辈能够多多指教,本人表示不胜感激。

posted @ 2009-07-15 16:00  ljlxyf  阅读(190)  评论(0编辑  收藏  举报