Google提供同义词的搜索结果 尝试自然语言理解技术
Google官方博客今天号称现在已经将自然语言理解技术用于搜索中同义词的识别,比方在一定的上下文环境中Google搜索认为"pictures"和"photos"是相同的,以 [pictures developed with coffee]这个查询为例,可以看见搜索结果中的"photos"被加粗了,这是一次大胆的尝试,这要源于Google发现70%的人在搜索中使用同义词,通过四年的努力,Google现在的同义词识别错误率为1/50,也就是说每50个使用同义词识别的查询中会出现一次错误识别。比方 [dell system speaker driver precision 360],Google认为"precision"与"PC"是同义词。
自然语言理解是人工智能中难点,Google通过分析数PB(1,000,000,000,000,000 (1015)字节)的Web文档提取的同义词,可以根据不同的语境识别不同的同义词,如:
[dura ace track bb axle njs], Google认为 "bb"表示"bottom bracket".
[software update on bb color id], "bb"表示"blackberry "
[bb cream dark], 这里的bb被认为是 "blemish balm".
[southeastern usa bb fitness & figure],这里的"bb." 的同义词是"bodybuilding"
根据文章介绍,Google主要分析用户查询和页面内容的关联,比方大量用户查询"XYZ BCN",但搜索结果页面中却使用"XYZ Barcelona",Google认为"BCN"是"Barcelona"的同义词,当然这必须是使用"XYZ"的这种上下文环境下。下面是关于Google同义词识别技术的一个简单介绍《Making search better in Catalonia, Estonia, and everywhere else》。
Matt Cutts在其博客也建议站长SEO不要在文章中堆砌相同意义的不同形式的关键词。不过不大可能,因为不是所有语境下都使用同义词结果。
最新相关内容: Google实时搜索中Tweets排名关键因素:Followers Google实时搜索:2分钟感知地震 Google实时搜索 流模式的搜索结果 Google下一代搜索引擎 Caffeine+实时+社会化+个性化 国外SEO对Google Caffeine的测试 |
将 本 文 收 藏 到: