摘要: 基于数据库的搜索 基于spider抓取的站内搜索 全文检索者站内搜索软件系统 原理 数据库搜索 通过Spider抓取网页,经html解析,分词,索引实现网页式站内搜索。 对数据库数据进行html解析、图片缩略,分词,索引,实现站内搜索。 检索效率 非常低下 消耗大量硬件资源 高效 高效 检索范围 无法完成全文检索(可以用sql的单字索引功能最简单的完成索引功能实现最低级的全文检索),只能进行标题检索。 数据库效率太低,无法开展各种附加功能。 网页检索 优点:不需要做各种工作,直接即可使用 缺点: 1.有大量的不必要的信息影响搜索结果的排序和显示的效果。严重影响精确度。 2.部分页面无法抓取到. 阅读全文
posted @ 2011-03-23 13:04 Byrd 阅读(1279) 评论(0) 推荐(0) 编辑