TREC 2009 Web Track于本月17日到20日在美国马里兰举行,关于TREC,就是文本信息检索大会,由美国国防部和美国国家技术标准局联合举办,从1992年开始每年举行一次,通过为学术界提供大规模文本检索技术评测评估的基础设施来推动信息检索技术的研究以及加速科技到产品的转换,包括MIT,Stanford,Google,微软等著名的大学与公司都是参与者,更多可以参见Text Retrieval Conference。下面我们来看TREC 2009 Web Track有可能对SEO与Google优化产生的影响。
Web Track也就是TREC在Web领域的信息检索任务,TREC 2009 Web Track采用了新的来自商业搜索引擎的10亿级数据集ClueWeb09,而且这次Web Track重点是一个称之为Web多样性的任务,希望组合老的Track的成果,为查询生成多样性的搜索结果,对一个查询进行全面的覆盖,避免冗余结果,以Windows这个主题的搜索为例,期望第一个结果是关于Windows更新的页面,下一个结果是微软的主页,接下来是一些关于Windows7发布的讨论以及关于Windows产品信息等等,但是目前对这次会议的结果还不得而知。
其实对于搜索结果多样性,主流的搜索引擎都在解决这个问题,但是明显效率存在问题,当碰到一些新的主题,出现大量的重复文章,Google明显反应不过,出现大量冗余结果,搜索结果页的充满相同标题与文字,可能是工业界的需求驱动了这次搜索结果多样性技术的研究。
如果真的能解决这个问题,效率有所提高,我想原创的独特性文章将获得较高的排名,在突发性新闻的巨大流量面前就获得应有的流量。Google也避免和传统新闻媒体纠缠不休,但是有些问题并不是那么容易解决的。
最新相关内容:
Google搜索结果显示重大改变 使用页面上的导航路径替换页面URL串
Google社会化搜索(Social search)进入实验阶段
Matt Cutts:Caffeine将在明年初全部上线
Google Caffeine结束测试 准备正式上线
Google搜索选项框增加页面预览功能(Page PreViews)
将本文收藏到: 365Key