摘要: 本文主要目录如下:一、背景二、概念及原理三、技术选型四、需求矩阵一、背景随着网络的不断发展,各种网页铺天盖地,信息资源泛滥,如何有效的提取并利用这些信息成为一个巨大的挑战,搜索引擎(Search Engine)如Google、Baidu等,作为一个辅助人们检索信息的工具成为用户访问万维网的入口和指南。但是,这些通用性搜索引擎也存在着一定的局限性,见下图:1、网页资源无关性问题:专业搜索引擎由于它的客户群体太泛泛,所以用户进行搜索时经常搜索到自己并不想要的资源;2、网络覆盖率问题:有限的搜索引擎与无限的网络数据资源是矛盾的;3、数据结构化问题:搜索引擎对于一定结构的数据是无能为力的;4、语义检索 阅读全文
posted @ 2012-12-06 16:47 李蒙强 阅读(6411) 评论(30) 推荐(7) 编辑