摘要: 注:原文先是介绍了netflix的竞赛和推荐系统的分类,这些内容都被我略过,直接翻译了最主要的问题。所以,下文中提到的“竞争者”就是netflix竞赛的参与者,而“第五类算法”就是指如下四类推荐算法之外的第五种。四类推荐算法: * 个性化的推荐:基于用户过去的行为作出推荐。 * 社会推荐:基于相似用户的过去的行为进行推荐。 * 基于item的推荐:基... 阅读全文
posted @ 2009-09-12 21:50 搜源网 阅读(152) 评论(0) 推荐(0) 编辑
摘要: 网络爬虫(Web Crawler, Spider)就是一个在网络上乱爬的机器人。当然它通常并不是一个实体的机器人,因为网络本身也是虚拟的东西,所以这个“机器人”其实也就是一段程序,并且它也不是乱爬,而是有一定目的的,并且在爬行的时候会搜集一些信息。例如 Google 就有一大堆爬虫会在 Internet 上搜集网页内容以及它们之间的链接等信息;又比如一些别有用心的爬虫会在 ... 阅读全文
posted @ 2009-09-12 18:49 搜源网 阅读(745) 评论(0) 推荐(0) 编辑
摘要: 技术与人文的结晶 ——搜索引擎技术漫谈 ■ 康乐 面对浩瀚的信息海洋,人们常常无所适从。而网络搜索引擎的出现,恰似一叶轻舟,载着我们在海洋里随意遨游。搜索引擎很快就成为我们掌握知识的利器。 作为Internet必不可少的工具,搜索引擎的地位越来越高。不仅如此,随着Internet应用的不断加深,搜索引擎正成为举足轻重的网络基础设施。 搜索引擎的基础设施作用体现在... 阅读全文
posted @ 2009-09-12 18:39 搜源网 阅读(152) 评论(0) 推荐(0) 编辑
摘要: 一个专门为程序员开发的搜索引擎!网页搜索:http://www.openso.net/开源搜索:http://www.openso.net/querycode?index=1&word=电子书搜索:http://www.openso.net/queryebook?index=1&word=工具搜索:http://www.openso.net/querytool?index=1&am... 阅读全文
posted @ 2009-09-12 18:23 搜源网 阅读(549) 评论(1) 推荐(0) 编辑