2014年4月19日

浅析PageRank算法

摘要: 文章转自:http://blog.codinglabs.org/articles/intro-to-pagerank.html很早就对Google的PageRank算法很感兴趣,但一直没有深究,只有个轮廓性的概念。前几天趁团队outing的机会,在动车上看了一些相关的资料(PS:在动车上看看书真是一... 阅读全文

posted @ 2014-04-19 21:30 theCambrian.cpp 阅读(909) 评论(1) 推荐(1) 编辑

搜索引擎(网络爬虫篇)

摘要: 网络搜索引擎的构架一个专业的网络搜索引擎至少包含3部分即抓取、处理和搜索。下面是它们的一般功能:抓取:抓取(蜘蛛、爬虫、crawler、spider等)程序负责爬行特定网络(也可能是整个网络),把网络上的页面和其它需要的文件下载到本地来。目前的难点是web2.0的普及导致的js分析和身份认证等问题。... 阅读全文

posted @ 2014-04-19 21:07 theCambrian.cpp 阅读(750) 评论(0) 推荐(0) 编辑

导航