搜索技术的历史
搜索技术历史:
- 搜索技术的历史—萌芽阶段:Archie 、Gopher
最早出现的搜索引擎:
1990年,加拿大蒙特利尔(Montreal)的麦吉尔大学学生Alan Emtage、Peter Deutsch、Bill Wheelan发明了一个自动索引互联网上匿名FTP网站文件的程序Archie
(只能索引网络上的文件)
Gopher搜索协议
1991年美国明尼苏达大学学生Mark McCahill发明了一种名为Gopher的搜索协议
(具有Archie的功能,还可以对网页进行索引)
- 搜索技术的历史—起步阶段:Robot 、Spider
Robot 网络机器人
1993年MIT Matthew Gray的World wide Web Wanderer,用于追踪互联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。
Spider网络爬虫
1993年10月Martijn Koster创建了ALIWEB(Martijn Koster Annouces the Availability of Aliweb),它相当于Archie的HTTP版本。ALIWEB允许用户提交自己网站简介信息,但这有一个缺点,用户认为不需要提交站点。(不需要通过网络抓取数据。不会消耗大量带宽。数据信息有限)
(Martijn Koster是机器人拒绝协议Robots Exclusion主要设计参与者,这个协议是现代搜索引擎的标准功能之一)
- 搜索技术的历史—发展阶段: Excite 、Galaxy、Yahoo
Excite
1993年2月,6个Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。这就是Excite。后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile
Galaxy
1994年1月,第一个既可搜索又可浏览的分类目录EINet Galaxy(Tradewave Galaxy)上线。除了网站搜索,它还支持Gopher和Telnet搜索
Yahoo
1994年4月,Stanford两名博士生,美籍华人Jerry Yang(杨致远)和David Filo共同创办了Yahoo。
Yahoo目录开始支持简单的数据库搜索。因为Yahoo的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。搜索效率明显提高。(Yahoo以后陆续使用Altavista、Inktomi、Google提供搜索引擎服务)
第一个支持搜索文件全部文字的全文搜索引擎
1994年初,Washington大学CS学生Brian Pinkerton开始了他的小项目WebCrawler(Brian Pinkerton Announces the Availability of Webcrawler)。1994年4月20日,WebCrawler正式亮相时仅包含来自6000个服务器的内容。WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。(后来webcrawler陆续被AOL和Excite收购,现在和excite一样改用元搜索引擎Dogpile)
Lycos
Lycos(Carnegie Mellon University Center for Machine Translation Announces Lycos )是搜索引擎史上又一个重要的进步。Carnegie Mellon University的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了Lycos。1994年7月20日,数据量为54,000的Lycos正式发布。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量:1994年8月--394,000 documents;1995年1月--1.5 million documents;1996年11月--over 60 million documents。(注:1999年4月,Lycos停止自己的Spider,改由Fast提供搜索引擎服务)
- 搜索技术的历史—繁荣阶段: Infoseek 、Alta Vista ,Google ,Baidu
Infoseek以相关性闻名
1994年底, Infoseek友善的用户界面、大量附加服务(such as UPS tracking, News, a directory, and the like) 使它声望日隆。而1995年12月与Netscape的战略性协议,使它成为一个强势搜索引擎。(虽然公司声称1994年1月已创立,但直到年底它的搜索引擎才与公众见面)
这个搜索引擎沿用的Yahoo和Lycos的概念,没有什么独特的创新。2001年2月,Infoseek停止了自己的搜索引擎,开始改用Overture的搜索结果。这让我懂得技术好再加上UI设计好才算是完美。早几年出生我就学美术了~~
Alta Vista第一个支持自然语言搜索
1995年12月, Alta Vista推出第一个支持自然语言搜索的搜索引擎 。 AltaVista是一个以网页全文检索为主、同时提供分类目录的搜索引擎。内容极其丰富,真正可以称海量信息检索。
AltaVista于1995年由迪吉多公司(Digital Equipment Corporation)创立。2003年被 Overture 以1.4亿美元现金加股票的形式购得,同年转手给雅虎[1]。 北京时间2013年6月29日,雅虎宣布将于2013年7月8日关闭搜索引擎AltaVista服务。
1998年Google(谷歌)创始人拉里.佩奇和布林在美国斯坦福大学的学生宿舍内共同开发了全新的在线搜索引擎,然后迅速传播给全球的信息搜索者.Google 被公认为全球最大的搜索引擎
Baidu
百度(Nasdaq简称:BIDU)是全球最大的中文搜索引擎,2000年1月由李彦宏、徐勇两人创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。“百度”二字源于中国宋朝词人辛弃疾的《青玉案·元夕》词句“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。
2000年5月百度首次为门户网站“硅谷动力”提供搜索技术服务。之后它迅速占领中国搜索引擎市场。2001年8月百度公司发布了baidu.com搜索引擎beta版,从后台服务转向了独立提供搜索服务。2001年10月22日,正式发布baidu搜索引擎。2005年8月5日,百度在纳斯达克上市
出处:https://www.cnblogs.com/gne-hwz/
版权:本文版权归作者和博客园共有
转载:欢迎转载,但未经作者同意,必须保留此段声明;必须在文章中给出原文连接;否则必究法律责任