摘要: 编者按:这是一篇精彩的编程教学文章,不但详细地剖析了搜索引擎的原理,也提供了笔者自己对使用PHP编制搜索引擎的一些思路。整篇文章深入浅出,相信无论是高手还是菜鸟,都能从中得到不少的启发。 谈到网页搜索引擎时,大多数人都会想到雅虎。的确,雅虎开创了一个互联网络的搜索时代。然而,雅虎目前用于搜索网页的技术却并非该公司原先自己开发的。2000年8月,雅虎采用了Google(www.google.c... 阅读全文
posted @ 2006-10-17 14:45 小y 阅读(1180) 评论(3) 推荐(0) 编辑
摘要: 凡上网者都用过搜索引擎,Altavista、Infoseek 、Hotbot、网络指南针、北大天网和华好网景的ChinaOK等等,它们的索引数据库涉及Internet上超过1亿的页面(Altavista和Hotbot),北大天网也收集了32万个www页面(国内),索引数据库的建立需要访问这些页面然后进行索引,如何做到对如此多的页面的访问,现在的搜索引擎无论是针对英文还是中文,都是采用网上机器人来实... 阅读全文
posted @ 2006-10-17 14:40 小y 阅读(605) 评论(0) 推荐(0) 编辑
摘要: 第三代搜索引擎技术与P2P 第二代搜索引擎虽然比第一代在搜索速度、针对多种语言信息的扩展等方面有所改进,在以自然语言为查询语言方面也... 阅读全文
posted @ 2006-10-17 14:33 小y 阅读(1027) 评论(4) 推荐(0) 编辑
摘要: 更多内容:http://www.stlchina.org/twiki/bin/view.pl/Main/SearchEngine 网络蜘蛛基本原理 网络蜘蛛即Web Spider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页,从 网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通... 阅读全文
posted @ 2006-10-17 14:27 小y 阅读(1452) 评论(2) 推荐(0) 编辑