摘要: VIPS 是 Microsoft Research Asia 的几位实习学生提出的算法,可在 MSR 里面查看详细信息,另外还有中文简略介绍,还有一个 C# 写的简单实现。他们的思想是根据HTML源代码在浏览器中的显示属性来确定一个页面到底要需要分成哪些块。简单的说就是将页面切割成一块一块的,页面是一块,页脚是一块,中间是一块,然后中间又根据内容分成更细的块,整个过程是一个迭代的过程。最后对于太小... 阅读全文
posted @ 2007-04-26 22:24 cacard 阅读(1793) 评论(0) 推荐(0) 编辑
摘要: xunlei 是资源的垂直搜索引擎,flickr 是photo/images,youtube 应该是视频,digg 是社会化新闻,ctrip/qunar应该是酒店、旅行相关,大众点评是餐馆,豆瓣是 book/movie/music,myspace 应该是社区,qihoo 不怎么垂直,应该是传统搜索引擎,这也包括其他专业的 blog 搜索引擎,这类网站迟早被 google/baidu 干掉,因为他们... 阅读全文
posted @ 2007-04-26 01:34 cacard 阅读(863) 评论(8) 推荐(0) 编辑