Google搜索从入门到精通v4.0
6,初阶搜索
6.1,搜索结果要求包含两个及两个以上关键字
6.2,搜索结果要求不包含某些特定信息
6.3,搜索结果至少包含多个关键字中的任意一个
7,杂项语法
7.1,通配符问题
7.2,关键字的字母大小写
7.3,搜索整个短语或者句子
7.4,搜索引擎忽略的字符以及强制搜索
8,进阶搜索
8.1,对搜索的网站进行限制
8.2,查询某一类文件
8.3,搜索的关键字包含在URL链接中
8.4,搜索的关键字包含在网页标题中
8.5,搜索的关键字包含在网页“锚”内
9,其他罕用语法
9.1,搜索所有链接到某个URL地址的网页
9.2,查找与某个页面结构内容相似的页面
9.3,从Google服务器上缓存页面中查询信息
10,图片搜索
11,目录检索
12,新闻组搜索
13,Google的其他杰出功能
13.1,网页快照
13.2,集成化的工具条
13.3,单词英文解释
13.4,网页翻译
13.5,单词纠错
13.6,搜索结果过滤
14,Google尚未发布的一些新特性和功能
14.1,对网页更新日期做出限定
14.2,新闻搜索
14.3,分类广告搜索
14.4,其它Google的最新发展动态
14.5,一个有趣的地方
15,后记
——————————————————————————————————
“公欲善其事,必先利其器”。Internet只有一个,而搜索引擎则有N多个。有搜索高
手说,所谓搜索,就是“在正确的地方使用正确的工具和正确的方法寻找正确的内容”。
6,初阶搜索
最基本的搜索,即查询包含单个关键字的信息。但是单个关键字搜索得的信息浩如烟海,而且绝大部分并不符合自己的要求,怎么办呢?我们需要进一步缩小搜索范围和结果。
6.1,搜索结果要求包含两个及两个以上关键字
一般搜索引擎需要在多个关键字之间加上“ ”,而Google无需用明文的“ ”来表示逻辑“与”操作,只要空格就可以了。
6.2,搜索结果要求不包含某些特定信息
Google用减号“-”表示逻辑“非”操作。“A –B”表示搜索包含A但没有B的网页。
注意:这里的“ ”和“-”号,是英文字符,而不是中文字符的“+”和“-”。此外,
操作符与作用的关键字之间,不能有空格。比如“搜索引擎 - 文化”,搜索引擎将视
为关键字为“搜索引擎”和“文化”的逻辑“与”操作,中间的“-”被忽略。
6.3,搜索结果至少包含多个关键字中的任意一个。
Google用大写的“OR”表示逻辑“或”操作。搜索“A OR B”,意思就是说,搜索的网
页中,要么有A,要么有B,要么同时有A和B。
注意:“与”操作必须用大写的“OR”,而不是小写的“or”。"OR"两边都有空格的。
7,杂项语法
7.1,通配符问题
很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。Google对通配符支持有限。
它目前只可以用“*”来替代单个字符,而且包含“*”必须用""引起来。
比如,“"以*治国"”,表示搜索第一个为“以”,末两个为“治国”的四字短语,中间的“*”可以为任何字符。
7.2,关键字的字母大小写
Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。
7.3,搜索整个短语或者句子
Google的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,
用短语做关键字,必须加英文引号,否则空格会被当作“与”操作符。
7.4,搜索引擎忽略的字符以及强制搜索
Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及
一些符号如“*”、“.”等,作忽略处理。
搜索引擎分词的知识:当我们在搜索“www的历史”的时候,搜索引擎实际上把这个
短语分成三部分,“www”、“的”和“历史”分别来检索,这就是搜索引擎的分词。
所以尽管你输入了连续的“www的历史”,但搜索引擎还是把这个短语当成三个关键字
分别检索。
如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。
另一个强制搜索的方法是把上述的关键字用英文双引号引起来。
在上例“”world war I””中,“I”其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语。
注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。
8,进阶搜索
8.1,对搜索的网站进行限制
“site”表示搜索结果局限于某个具体网站或者网站频道,如“www.sina.com.cn”、
“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除
某网站或者域名范围内的页面,只需用“-网站/域名”。
搜索:“搜索引擎 技巧 site:edu.cn”
搜索:“"search engine" tips site:www.zdnet.com OR site:www.cnet.com”
注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作
为一个搜索的关键字。此外,网站域名不能有“http://”前缀,也不能有任何“/”的
目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。
8.2,在某一类文件中查找信息
“filetype:”是Google开发的非常强大实用的一个搜索语法。也就是说,Google不仅
能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,Google已经能检索微
软的Office文档如.xls、.ppt、.doc,.rtf,WordPerfect文档,Lotus1-2-3文档,
Adobe的.pdf文档,ShockWave的.swf文档(Flash动画)等。
搜索:“资产负债表 filetype:doc OR filetype:xls OR filetype:ppt”
注意,下载的Office文件可能含有宏病毒,谨慎操作。
Google用[PDF]来标记这是一个PDF的文档检索,另外,它还给出了该PDF文档的HTML版本,该HTML版保留了文档的文字内容和结构
8.3,搜索的关键字包含在URL链接中
“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。
有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,
于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。
INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。
示例:查找MIDI曲“沧海一声笑”。
搜索:“inurl:midi “沧海一声笑””
注意:“inurl:”后面不能有空格,Google也不对URL符号如“/”进行搜索。
例如,Google会把“cgi-bin/phf”中的“/”当成空格处理。
“allinurl”语法返回的网页的链接中包含所有作用关键字。
这个查询的关键字只集中于网页的链接字符串。
示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGI-BIN目录中含有PHF
脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。
搜索:“allinurl:"cgi-bin" phf +com”
8.4,搜索的关键字包含在网页标题中
“intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对URL
进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中
之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标
题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。 示例:查找日本
明星藤原纪香的照片集。
搜索:“intitle:藤原纪香 "写真集"”
8.5,搜索的关键字包含在网页的“锚”(anchor)链点内
所谓“锚”,就是在同一个网页中快速切换链接点。与URL和TITLE类似,Google提供
了两种对anchor的检索,“inanchor”和“allincnchor”。对此不作详述。
9,其他罕用语法
9.1,搜索所有链接到某个URL地址的网页
如果你拥有一个个人网站,估计很想知道有多少人对你的网站作了链接。而“link”语
法就能让你迅速达到这个目的。
示例:搜索所有含指向华军软件园“www.newhua.com”链接的网页。
搜索:“link:www.newhua.com”
注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被
Google忽略。另外还要说明的是,link只列出Google索引链接很小一部分,而非全部,
所以如果你用Google没有搜到链到你的主页的链接,也不必灰心丧气。
除了上述功能,link语法还有其它妙用。一般说来,做友情链接的网站都有相似地方。
这样,你可以通过这些友情链接,找到一大批具有相似内容的网站。比如说,你是个天
文爱好者,你发现某网站非常不错,那么,可以用link语法查一下与之做链接的网站,
也许可以找到更多符合你兴趣的内容。
9.2,查找与某个页面结构内容相似的页面
“related”用来搜索结构内容方面相似的网页。例:搜索所有与中文新浪网主页相似
的页面(如网易首页,搜狐首页,中华网首页等),
“related:wwwsina.com.cn/index.shtml”。我到现在也不明白这个语法有什么作用,
如果有谁知道,请不吝指教。预先感谢。:)
9.3,从Google服务器上缓存页面中查询信息
“cache”用来搜索Google服务器上某页面的缓存,通常用于查找某些已经被删除的死
链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。
其它罕用语法如info、stock等不一一介绍,有兴趣的读者可以参阅Google大全。
10,图片搜索
Google自称可以检索390,000,000张图片,并称自己为“互联网上最好用的图像搜索工
具”。从使用结果来看,Google的图片搜索的确不错,但个人以为比AltaVista的还是
要差一些,主要体现在检索图片数量比不上AV,匹配度比AV的图片搜索器也差了些。
但AltaVista国内用户无法正常访问,因此对中国用户而言,Google的图片搜索引擎已
经是最好的了。
Google首页点击“图像”链接就进入了Google的图像搜索界面
“images.Google.com”。你可以在关键字栏位内输入描述图像内容的关键字,如
“britney spears”,就会搜索到大量的小甜甜布兰妮的图片。我目前尚不是很清楚图
片的排列标准,不过以观察来看,似乎图片文件名完全符合关键字的结果排列比较考前,
然后才按照普通的页面搜索时的标准排列。
Google给出的搜索结果具有一个直观的缩略图(THUMBNAIL),以及对该缩略图的简单
描述,如图像文件名称,以及大小等。点击缩略图,页面分成两祯,上祯是图像之缩略
图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“Remove Frame”
的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。
Google图像搜索目前支持的语法包括基本的搜索语法如“ ”、“-”、“OR”、“site”
和 “filetype:”。其中“filetype:”的后缀只能是几种限定的图片类似,如JPG,GIF
等。
示例:查找新浪网上本拉登的图片
搜索:“拉登 OR 拉丹 site:sina.com.cn”
结果:搜索有关 拉登 OR 拉丹 site:sina.com.cn 的图片。 共有6项查询结果,这是
第1-6项。 搜索用时0.36秒。
这里我想说明一点的是,images.google.com作为专门的图片搜索引擎,实际上有其特
殊的用途。
举个例子,互联网上本拉登的照片成千上万,但是,它们都是分散的,往往随机的分布
于各种新闻报道中。如果用搜索图片库的方式(最容易想到的如“Ben Ladin photo”),
来搜索本拉登的照片,显然是不恰当的,因为很少有人专门为拉登建一个在线相册。在
这个时候,images.google.com就派上用场了。
但是,如果查找的图片在网上有很多主题“gallary”,如诸多电影电视明星的照片,
则明显就不适合用images.google.com来查找了。
images.google.com对于很多报纸杂志的编辑,绝对是一个雪中送炭式的工具。比如要
在某个版面上插一张专题图片,用google的图片搜索功能几秒钟就可以搞定。
综上,可以有这样的一般性结论:如果要搜索的图片是分散的,则用google图片搜索;
如果要搜索的图片通常是处于某个图片集合中的,则不适合用google图片搜索。
11,目录检索
如果不想搜索广泛的网页,而是想寻找某些专题网站,可以访问Google的分类目录
“http://directory.Google.com/”,中文目录是
“http://directory.Google.com/Top/World/Chinese_Simplified/”。分类的网站目
录一般由专人负责,分类明确,信息集中。因此读者应该养成这样的习惯:首先考虑所
需要的信息能否在一个专门主题的网站上找到。不过需要说明的是,用目录检索,往往
需要用户对查询的领域很熟悉。否则,连查询的内容属于哪个类目都不知道,目录浏览
也就无从谈及了。 目前Google使用的分类目录采用了ODP的内容。“Open Directory
Project”是网景公司所主持的一项大型公共网页目录。由全世界各地的义务编辑人员
来审核挑选网页,并依照网页的性质及内容来分门别类。因此,在某一目录门类中进行
搜索往往能有更高的命中率。另外,Google根据其专业的“网页级别”(PageRank)技
术对目录中登录的网站进行了排序,可以让一般的检索更具高效率。
示例:查找一下介绍搜索引擎方面的中文网站
搜索:先进入中文简体分类目录,再进入“计算机”目录,再进入“互联网络”子目录,
再进入“搜寻”子目录。我们看到在“World > Chinese Simplified > 计算机 > 互联
网络 > 搜寻”下,还有两个子目录“分类目录 (33) 搜索引擎 (10)”,以及6个相关
网站。显然,这些都是我们所需要的信息。
除了用鼠标层层点入,也可以在目录中检索。比如,在上例的“互联网络”目录下,选
中“只在互联网络中搜索”选项,在搜索栏内填入“搜索引擎”进行搜索。
结果:在分类Google 网页目录项中搜索搜索引擎。 共约有387项查询结果,这是第
11-20项 。 搜索用时0.09秒。
可以看到,上述查询结果比普通的检索更有效,因为在分类“互联网络”下进行搜索剔
除了很多不相关的诸如新闻之类的无效信息。不过,对于中文用户而言,现在最大的问
题是志愿的中文目录编辑太少,导致收录站点太少,因此搜索结果范围显得过于狭隘。
但愿这个问题能随着Google以及ODP项目在国内名声的响亮而能得到改观。
12,新闻组搜索
新闻组有详尽的分类主题,某些主题还有专人管理和编辑,具有大量的有价值信息。由
于新闻组包含的信息实在是海量,因此不利用工具进行检索是不大可能的。DEJA一直是
新闻组搜索引擎中的佼佼者。2001年2月份,Google将DEJA收购并提供了所有DEJA
的功能。现在,除了搜索之外,Google还支持新闻组的WEB方式浏览和张贴功能。
进入Google新闻组“http://groups.Google.com/”,你有两种信息查找方式。一种是
一层层的点击进入特定主题讨论组,另一种则是直接搜索。现在,我们进行一个最简单
的搜索试验,查找一下新闻组中关于山顶洞人的讨论信息。
搜索:“山顶洞人”
结果:在各群组内搜索 山顶洞人 共约有2,400项查询结果,这是第1-10项 。 搜索
用时0.94秒。 搜索结果默认按照“留言内容”排列,但是你也可以点击“依照日期”
按钮,让帖子按照发布日期排列。
因为新闻组中的帖子实在是多,而且又涉及一些普通搜索所没有的语法,所以建议使用
“高级群组搜寻”进入高级搜索界面。新闻组高级搜索提供留言内容、分类主题、标题、
留言者、留言代码、语言和发布日期作为条件进行搜索。其中作者项指作者发帖所用的
唯一识别号电子信箱。
13,Google的其他杰出功能
13.1网页快照
网页快照是Google抓下来缓存在服务器上的网页。它有三个作用:
第一, 如果原地址打开很慢,那么可以直接查看Google缓存页面,因为Google服务
器速度极快。
第二, 如果原链接已经死掉或者因为网络的原因暂时链接不通,那么可以通过Google
快照看到该页面信息。当然,快照内容不是该页最新页面。
第三, 如果打开的页面信息量巨大,一下子找不到关键词所在位置,那么可以通过
Google快照,因为快照中Google用黄色表明关键字位置。
13.2,集成化的工具条
为了方便搜索者,Google提供了工具条,集成于浏览器中,用户无需打开Google主页
就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其他许多功能,如显示
页面PageRank等。最方便的一点在于用户可以快捷的在Google主页、目录服务、新闻
组搜索、高级搜索和搜索设定之间切换。欲安装Google的工具条,可以访问
“http://toolbar.Google.com/”,按页面提示可以自动下载并安装。不过,Google
工具条目前只支持IE5.0以上版本。
对于经常进行网络搜索者而言,Google工具条实在是必备的东西!!
13.3,单词英文解释
写英文文章的时候,最头疼的事情就是对某个英文单词的用法不确定。现在有了Google,
一切就迎刃而解了!无论你是想查找某个生词的意思还是想了解某个单词的用法,均可
使用在线词典。
进入英文Google,输入你要查的单词。举个例子,我想查一下suggest的用法。结果如
下:“Searched the web for suggest. Results 1 - 10 of about 8,000,000. Search
took 0.08 seconds. ”注意看上面句子中,单词suggest下出现了一个横线,点击这
个链接,就跳转到另外一个网站“http://www.dictionary.com/”,Google已经把单词
提交给该网站的查询脚本。看看这个网站所提供的详尽解释吧。:)
13.4,网页翻译
你懂英文,但是你不见得就懂德文、法文、拉丁文。如果搜索出来的页面是这些语言怎
么办?呵呵,Google提供了网页翻译功能!!虽然目前只支持有限的拉丁语、法语、西
班牙语、德语和葡萄牙文,但是我不得不承认,这是个杰出功能。
试着做以下搜索:“big bang site:fr”。这个表示查找关于宇宙大爆炸的法文网页。
看第一条结果:
The Big Bang Website - [ Translate this page ]
... A propos de Big Bang. Le dernier numéro en date. Les anciens numéros. Autresactivités. Concerts progressifs en France. Emissions de radio. Liens.
perso.club-internet.fr/calyx/bigbang/ - 3k - Cached - Similar pages
有点晕。没关系,点击“Translate this page”按钮。再看结果,嗯,大致能看明白,
这原来是个叫“big bang”的乐队的网站,与大爆炸无关...
机器翻译是一个很前沿的人工智能课题,想指望翻译出来的结果跟专门用英语撰写的内
容是不可能的。但西文间的互相转译比中英文机译强得多得多了。至少能看明白。
13.5,单词纠错
笔者记忆力很差,英文单词经常拼写错误。但Google有纠错功能。比如在写上文的时
候,我要用到英文单词“tutorial”,我只是依稀记得好像是“tatorial”的样子,但
不肯定,于是用Google查了一下,它马上提醒:“您要找的会不会是: tutorial ”,
呵呵,正是这个单词。
13.6,繁简转换
对中文用户而言,常希望能同时检索繁体和简体信息。Google能做到这一点。Google
默认使用繁简自动转换功能,因此你输入的简体关键字也将被转换成繁体做检索。这样
省了不少力气。当然,如果你不希望这样的话,也可以在“使用偏好”中把这个选项关
掉。
13.7,搜索结果过滤
网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易
掉入其中的陷阱。为此,Google新设立了成人内容过滤功能,见Google的设置页面,
http://www.Google.com/preferences,最底下有一个选项SafeSearch Filtering。不
过,中文状态下的Google尚没有这个功能。
14,Google尚未发布的一些新特性和功能
14.1,对网页更新日期做出限定“daterange:”
评价一个搜索引擎的好坏,更新频率是一个很关键因素。通常情况下,我们总希望能找
到最新的网页。Google已经开发了对更新日期做限定的搜索语法,但目前还未公布。而
且比较麻烦的是,Google现在支持的日期格式为julian(凯撒日)格式,把通用日期
数值切换成julian格式需要借助第三方网站:
http://www.tesre.bo.cnr.it/~mauro/JD/。不过,在下面这个自称是“Google终极搜
索界面”的网页上,你已经可以利用Google的这项新特性了,它自动提供日期转换功
能。
Google Ultimate Interface:http://www.faganfinder.com/google.html
Google为什么要这样做呢?也许是在测试阶段,不想让太多人使用吧。:)
14.2,新闻搜索“http://news.google.com/”
Google的新闻搜索尚在B测试阶段,但使用起来已经非常不错了。新闻首页按头条新闻,
各国新闻,以及不同领域做了分类。你可以通过Google搜索各大门户和新闻网站的新
闻,简单、快捷、方便。遗憾的是,目前Google新闻只检索英文信息。
14.3,分类广告搜索“http://catalogs.google.com/”
这也在B测试阶段。主要是对电子分类广告做检索。广告页为JPG图片格式。
14.4,其它Google的最新发展动态
想了解Google公司的工程师们都在忙些什么吗?去看一下Google实验室
(http://labs.google.com/)吧。Google的最新设想都在这个地方向访问者展现出来。
现在处于发展和试验阶段的新功能有:术语查询、语音查询、键盘查询等等。
网络工程师和程序员可以看看这个地方:http://www.google.com/apis/,我想可以让
你喜出望外的。
14.5,一个有趣的地方
想看看世界各国网民都用Google搜索什么信息么?到
http://www.google.com/press/zeitgeist.html看一下就知道了。从这些资讯中,你大
致可以了解到世界热点和流行时尚走向。:)
15,后记
这个文章4.0版本与3.0版本相比,变更很大,主要把一些与Google无关的东西删除
了,另外随Google的变化作了一些修正,并增加了一些Google尚未发布的新功能。关
于搜索技巧和搜索实例,是各个搜索引擎共通的东西,是搜索者长期的经验积累,要写
出来,是件工程很浩大的事情,因此在这个小文章中我就不献丑了。
随着时间的推移,我发现搜索已经成为网络生活的一部分。工作需要搜索技术文档、客
户信息;购物需要搜索商品信息和指南;娱乐需要搜索相关背景资料和图片。搜索已经
变得无处不在,而Google则相应的成了工作和生活中的一个必备工具。套用雅虎的一
句广告词,我们也许应该这样说:“今天你Google了吗?”
6,初阶搜索
6.1,搜索结果要求包含两个及两个以上关键字
6.2,搜索结果要求不包含某些特定信息
6.3,搜索结果至少包含多个关键字中的任意一个
7,杂项语法
7.1,通配符问题
7.2,关键字的字母大小写
7.3,搜索整个短语或者句子
7.4,搜索引擎忽略的字符以及强制搜索
8,进阶搜索
8.1,对搜索的网站进行限制
8.2,查询某一类文件
8.3,搜索的关键字包含在URL链接中
8.4,搜索的关键字包含在网页标题中
8.5,搜索的关键字包含在网页“锚”内
9,其他罕用语法
9.1,搜索所有链接到某个URL地址的网页
9.2,查找与某个页面结构内容相似的页面
9.3,从Google服务器上缓存页面中查询信息
10,图片搜索
11,目录检索
12,新闻组搜索
13,Google的其他杰出功能
13.1,网页快照
13.2,集成化的工具条
13.3,单词英文解释
13.4,网页翻译
13.5,单词纠错
13.6,搜索结果过滤
14,Google尚未发布的一些新特性和功能
14.1,对网页更新日期做出限定
14.2,新闻搜索
14.3,分类广告搜索
14.4,其它Google的最新发展动态
14.5,一个有趣的地方
15,后记
——————————————————————————————————
“公欲善其事,必先利其器”。Internet只有一个,而搜索引擎则有N多个。有搜索高
手说,所谓搜索,就是“在正确的地方使用正确的工具和正确的方法寻找正确的内容”。
6,初阶搜索
最基本的搜索,即查询包含单个关键字的信息。但是单个关键字搜索得的信息浩如烟海,而且绝大部分并不符合自己的要求,怎么办呢?我们需要进一步缩小搜索范围和结果。
6.1,搜索结果要求包含两个及两个以上关键字
一般搜索引擎需要在多个关键字之间加上“ ”,而Google无需用明文的“ ”来表示逻辑“与”操作,只要空格就可以了。
6.2,搜索结果要求不包含某些特定信息
Google用减号“-”表示逻辑“非”操作。“A –B”表示搜索包含A但没有B的网页。
注意:这里的“ ”和“-”号,是英文字符,而不是中文字符的“+”和“-”。此外,
操作符与作用的关键字之间,不能有空格。比如“搜索引擎 - 文化”,搜索引擎将视
为关键字为“搜索引擎”和“文化”的逻辑“与”操作,中间的“-”被忽略。
6.3,搜索结果至少包含多个关键字中的任意一个。
Google用大写的“OR”表示逻辑“或”操作。搜索“A OR B”,意思就是说,搜索的网
页中,要么有A,要么有B,要么同时有A和B。
注意:“与”操作必须用大写的“OR”,而不是小写的“or”。"OR"两边都有空格的。
7,杂项语法
7.1,通配符问题
很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。Google对通配符支持有限。
它目前只可以用“*”来替代单个字符,而且包含“*”必须用""引起来。
比如,“"以*治国"”,表示搜索第一个为“以”,末两个为“治国”的四字短语,中间的“*”可以为任何字符。
7.2,关键字的字母大小写
Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。
7.3,搜索整个短语或者句子
Google的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,
用短语做关键字,必须加英文引号,否则空格会被当作“与”操作符。
7.4,搜索引擎忽略的字符以及强制搜索
Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及
一些符号如“*”、“.”等,作忽略处理。
搜索引擎分词的知识:当我们在搜索“www的历史”的时候,搜索引擎实际上把这个
短语分成三部分,“www”、“的”和“历史”分别来检索,这就是搜索引擎的分词。
所以尽管你输入了连续的“www的历史”,但搜索引擎还是把这个短语当成三个关键字
分别检索。
如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。
另一个强制搜索的方法是把上述的关键字用英文双引号引起来。
在上例“”world war I””中,“I”其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语。
注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。
8,进阶搜索
8.1,对搜索的网站进行限制
“site”表示搜索结果局限于某个具体网站或者网站频道,如“www.sina.com.cn”、
“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除
某网站或者域名范围内的页面,只需用“-网站/域名”。
搜索:“搜索引擎 技巧 site:edu.cn”
搜索:“"search engine" tips site:www.zdnet.com OR site:www.cnet.com”
注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作
为一个搜索的关键字。此外,网站域名不能有“http://”前缀,也不能有任何“/”的
目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。
8.2,在某一类文件中查找信息
“filetype:”是Google开发的非常强大实用的一个搜索语法。也就是说,Google不仅
能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,Google已经能检索微
软的Office文档如.xls、.ppt、.doc,.rtf,WordPerfect文档,Lotus1-2-3文档,
Adobe的.pdf文档,ShockWave的.swf文档(Flash动画)等。
搜索:“资产负债表 filetype:doc OR filetype:xls OR filetype:ppt”
注意,下载的Office文件可能含有宏病毒,谨慎操作。
Google用[PDF]来标记这是一个PDF的文档检索,另外,它还给出了该PDF文档的HTML版本,该HTML版保留了文档的文字内容和结构
8.3,搜索的关键字包含在URL链接中
“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。
有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,
于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。
INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。
示例:查找MIDI曲“沧海一声笑”。
搜索:“inurl:midi “沧海一声笑””
注意:“inurl:”后面不能有空格,Google也不对URL符号如“/”进行搜索。
例如,Google会把“cgi-bin/phf”中的“/”当成空格处理。
“allinurl”语法返回的网页的链接中包含所有作用关键字。
这个查询的关键字只集中于网页的链接字符串。
示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGI-BIN目录中含有PHF
脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。
搜索:“allinurl:"cgi-bin" phf +com”
8.4,搜索的关键字包含在网页标题中
“intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对URL
进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中
之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标
题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。 示例:查找日本
明星藤原纪香的照片集。
搜索:“intitle:藤原纪香 "写真集"”
8.5,搜索的关键字包含在网页的“锚”(anchor)链点内
所谓“锚”,就是在同一个网页中快速切换链接点。与URL和TITLE类似,Google提供
了两种对anchor的检索,“inanchor”和“allincnchor”。对此不作详述。
9,其他罕用语法
9.1,搜索所有链接到某个URL地址的网页
如果你拥有一个个人网站,估计很想知道有多少人对你的网站作了链接。而“link”语
法就能让你迅速达到这个目的。
示例:搜索所有含指向华军软件园“www.newhua.com”链接的网页。
搜索:“link:www.newhua.com”
注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被
Google忽略。另外还要说明的是,link只列出Google索引链接很小一部分,而非全部,
所以如果你用Google没有搜到链到你的主页的链接,也不必灰心丧气。
除了上述功能,link语法还有其它妙用。一般说来,做友情链接的网站都有相似地方。
这样,你可以通过这些友情链接,找到一大批具有相似内容的网站。比如说,你是个天
文爱好者,你发现某网站非常不错,那么,可以用link语法查一下与之做链接的网站,
也许可以找到更多符合你兴趣的内容。
9.2,查找与某个页面结构内容相似的页面
“related”用来搜索结构内容方面相似的网页。例:搜索所有与中文新浪网主页相似
的页面(如网易首页,搜狐首页,中华网首页等),
“related:wwwsina.com.cn/index.shtml”。我到现在也不明白这个语法有什么作用,
如果有谁知道,请不吝指教。预先感谢。:)
9.3,从Google服务器上缓存页面中查询信息
“cache”用来搜索Google服务器上某页面的缓存,通常用于查找某些已经被删除的死
链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。
其它罕用语法如info、stock等不一一介绍,有兴趣的读者可以参阅Google大全。
10,图片搜索
Google自称可以检索390,000,000张图片,并称自己为“互联网上最好用的图像搜索工
具”。从使用结果来看,Google的图片搜索的确不错,但个人以为比AltaVista的还是
要差一些,主要体现在检索图片数量比不上AV,匹配度比AV的图片搜索器也差了些。
但AltaVista国内用户无法正常访问,因此对中国用户而言,Google的图片搜索引擎已
经是最好的了。
Google首页点击“图像”链接就进入了Google的图像搜索界面
“images.Google.com”。你可以在关键字栏位内输入描述图像内容的关键字,如
“britney spears”,就会搜索到大量的小甜甜布兰妮的图片。我目前尚不是很清楚图
片的排列标准,不过以观察来看,似乎图片文件名完全符合关键字的结果排列比较考前,
然后才按照普通的页面搜索时的标准排列。
Google给出的搜索结果具有一个直观的缩略图(THUMBNAIL),以及对该缩略图的简单
描述,如图像文件名称,以及大小等。点击缩略图,页面分成两祯,上祯是图像之缩略
图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“Remove Frame”
的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。
Google图像搜索目前支持的语法包括基本的搜索语法如“ ”、“-”、“OR”、“site”
和 “filetype:”。其中“filetype:”的后缀只能是几种限定的图片类似,如JPG,GIF
等。
示例:查找新浪网上本拉登的图片
搜索:“拉登 OR 拉丹 site:sina.com.cn”
结果:搜索有关 拉登 OR 拉丹 site:sina.com.cn 的图片。 共有6项查询结果,这是
第1-6项。 搜索用时0.36秒。
这里我想说明一点的是,images.google.com作为专门的图片搜索引擎,实际上有其特
殊的用途。
举个例子,互联网上本拉登的照片成千上万,但是,它们都是分散的,往往随机的分布
于各种新闻报道中。如果用搜索图片库的方式(最容易想到的如“Ben Ladin photo”),
来搜索本拉登的照片,显然是不恰当的,因为很少有人专门为拉登建一个在线相册。在
这个时候,images.google.com就派上用场了。
但是,如果查找的图片在网上有很多主题“gallary”,如诸多电影电视明星的照片,
则明显就不适合用images.google.com来查找了。
images.google.com对于很多报纸杂志的编辑,绝对是一个雪中送炭式的工具。比如要
在某个版面上插一张专题图片,用google的图片搜索功能几秒钟就可以搞定。
综上,可以有这样的一般性结论:如果要搜索的图片是分散的,则用google图片搜索;
如果要搜索的图片通常是处于某个图片集合中的,则不适合用google图片搜索。
11,目录检索
如果不想搜索广泛的网页,而是想寻找某些专题网站,可以访问Google的分类目录
“http://directory.Google.com/”,中文目录是
“http://directory.Google.com/Top/World/Chinese_Simplified/”。分类的网站目
录一般由专人负责,分类明确,信息集中。因此读者应该养成这样的习惯:首先考虑所
需要的信息能否在一个专门主题的网站上找到。不过需要说明的是,用目录检索,往往
需要用户对查询的领域很熟悉。否则,连查询的内容属于哪个类目都不知道,目录浏览
也就无从谈及了。 目前Google使用的分类目录采用了ODP的内容。“Open Directory
Project”是网景公司所主持的一项大型公共网页目录。由全世界各地的义务编辑人员
来审核挑选网页,并依照网页的性质及内容来分门别类。因此,在某一目录门类中进行
搜索往往能有更高的命中率。另外,Google根据其专业的“网页级别”(PageRank)技
术对目录中登录的网站进行了排序,可以让一般的检索更具高效率。
示例:查找一下介绍搜索引擎方面的中文网站
搜索:先进入中文简体分类目录,再进入“计算机”目录,再进入“互联网络”子目录,
再进入“搜寻”子目录。我们看到在“World > Chinese Simplified > 计算机 > 互联
网络 > 搜寻”下,还有两个子目录“分类目录 (33) 搜索引擎 (10)”,以及6个相关
网站。显然,这些都是我们所需要的信息。
除了用鼠标层层点入,也可以在目录中检索。比如,在上例的“互联网络”目录下,选
中“只在互联网络中搜索”选项,在搜索栏内填入“搜索引擎”进行搜索。
结果:在分类Google 网页目录项中搜索搜索引擎。 共约有387项查询结果,这是第
11-20项 。 搜索用时0.09秒。
可以看到,上述查询结果比普通的检索更有效,因为在分类“互联网络”下进行搜索剔
除了很多不相关的诸如新闻之类的无效信息。不过,对于中文用户而言,现在最大的问
题是志愿的中文目录编辑太少,导致收录站点太少,因此搜索结果范围显得过于狭隘。
但愿这个问题能随着Google以及ODP项目在国内名声的响亮而能得到改观。
12,新闻组搜索
新闻组有详尽的分类主题,某些主题还有专人管理和编辑,具有大量的有价值信息。由
于新闻组包含的信息实在是海量,因此不利用工具进行检索是不大可能的。DEJA一直是
新闻组搜索引擎中的佼佼者。2001年2月份,Google将DEJA收购并提供了所有DEJA
的功能。现在,除了搜索之外,Google还支持新闻组的WEB方式浏览和张贴功能。
进入Google新闻组“http://groups.Google.com/”,你有两种信息查找方式。一种是
一层层的点击进入特定主题讨论组,另一种则是直接搜索。现在,我们进行一个最简单
的搜索试验,查找一下新闻组中关于山顶洞人的讨论信息。
搜索:“山顶洞人”
结果:在各群组内搜索 山顶洞人 共约有2,400项查询结果,这是第1-10项 。 搜索
用时0.94秒。 搜索结果默认按照“留言内容”排列,但是你也可以点击“依照日期”
按钮,让帖子按照发布日期排列。
因为新闻组中的帖子实在是多,而且又涉及一些普通搜索所没有的语法,所以建议使用
“高级群组搜寻”进入高级搜索界面。新闻组高级搜索提供留言内容、分类主题、标题、
留言者、留言代码、语言和发布日期作为条件进行搜索。其中作者项指作者发帖所用的
唯一识别号电子信箱。
13,Google的其他杰出功能
13.1网页快照
网页快照是Google抓下来缓存在服务器上的网页。它有三个作用:
第一, 如果原地址打开很慢,那么可以直接查看Google缓存页面,因为Google服务
器速度极快。
第二, 如果原链接已经死掉或者因为网络的原因暂时链接不通,那么可以通过Google
快照看到该页面信息。当然,快照内容不是该页最新页面。
第三, 如果打开的页面信息量巨大,一下子找不到关键词所在位置,那么可以通过
Google快照,因为快照中Google用黄色表明关键字位置。
13.2,集成化的工具条
为了方便搜索者,Google提供了工具条,集成于浏览器中,用户无需打开Google主页
就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其他许多功能,如显示
页面PageRank等。最方便的一点在于用户可以快捷的在Google主页、目录服务、新闻
组搜索、高级搜索和搜索设定之间切换。欲安装Google的工具条,可以访问
“http://toolbar.Google.com/”,按页面提示可以自动下载并安装。不过,Google
工具条目前只支持IE5.0以上版本。
对于经常进行网络搜索者而言,Google工具条实在是必备的东西!!
13.3,单词英文解释
写英文文章的时候,最头疼的事情就是对某个英文单词的用法不确定。现在有了Google,
一切就迎刃而解了!无论你是想查找某个生词的意思还是想了解某个单词的用法,均可
使用在线词典。
进入英文Google,输入你要查的单词。举个例子,我想查一下suggest的用法。结果如
下:“Searched the web for suggest. Results 1 - 10 of about 8,000,000. Search
took 0.08 seconds. ”注意看上面句子中,单词suggest下出现了一个横线,点击这
个链接,就跳转到另外一个网站“http://www.dictionary.com/”,Google已经把单词
提交给该网站的查询脚本。看看这个网站所提供的详尽解释吧。:)
13.4,网页翻译
你懂英文,但是你不见得就懂德文、法文、拉丁文。如果搜索出来的页面是这些语言怎
么办?呵呵,Google提供了网页翻译功能!!虽然目前只支持有限的拉丁语、法语、西
班牙语、德语和葡萄牙文,但是我不得不承认,这是个杰出功能。
试着做以下搜索:“big bang site:fr”。这个表示查找关于宇宙大爆炸的法文网页。
看第一条结果:
The Big Bang Website - [ Translate this page ]
... A propos de Big Bang. Le dernier numéro en date. Les anciens numéros. Autresactivités. Concerts progressifs en France. Emissions de radio. Liens.
perso.club-internet.fr/calyx/bigbang/ - 3k - Cached - Similar pages
有点晕。没关系,点击“Translate this page”按钮。再看结果,嗯,大致能看明白,
这原来是个叫“big bang”的乐队的网站,与大爆炸无关...
机器翻译是一个很前沿的人工智能课题,想指望翻译出来的结果跟专门用英语撰写的内
容是不可能的。但西文间的互相转译比中英文机译强得多得多了。至少能看明白。
13.5,单词纠错
笔者记忆力很差,英文单词经常拼写错误。但Google有纠错功能。比如在写上文的时
候,我要用到英文单词“tutorial”,我只是依稀记得好像是“tatorial”的样子,但
不肯定,于是用Google查了一下,它马上提醒:“您要找的会不会是: tutorial ”,
呵呵,正是这个单词。
13.6,繁简转换
对中文用户而言,常希望能同时检索繁体和简体信息。Google能做到这一点。Google
默认使用繁简自动转换功能,因此你输入的简体关键字也将被转换成繁体做检索。这样
省了不少力气。当然,如果你不希望这样的话,也可以在“使用偏好”中把这个选项关
掉。
13.7,搜索结果过滤
网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易
掉入其中的陷阱。为此,Google新设立了成人内容过滤功能,见Google的设置页面,
http://www.Google.com/preferences,最底下有一个选项SafeSearch Filtering。不
过,中文状态下的Google尚没有这个功能。
14,Google尚未发布的一些新特性和功能
14.1,对网页更新日期做出限定“daterange:”
评价一个搜索引擎的好坏,更新频率是一个很关键因素。通常情况下,我们总希望能找
到最新的网页。Google已经开发了对更新日期做限定的搜索语法,但目前还未公布。而
且比较麻烦的是,Google现在支持的日期格式为julian(凯撒日)格式,把通用日期
数值切换成julian格式需要借助第三方网站:
http://www.tesre.bo.cnr.it/~mauro/JD/。不过,在下面这个自称是“Google终极搜
索界面”的网页上,你已经可以利用Google的这项新特性了,它自动提供日期转换功
能。
Google Ultimate Interface:http://www.faganfinder.com/google.html
Google为什么要这样做呢?也许是在测试阶段,不想让太多人使用吧。:)
14.2,新闻搜索“http://news.google.com/”
Google的新闻搜索尚在B测试阶段,但使用起来已经非常不错了。新闻首页按头条新闻,
各国新闻,以及不同领域做了分类。你可以通过Google搜索各大门户和新闻网站的新
闻,简单、快捷、方便。遗憾的是,目前Google新闻只检索英文信息。
14.3,分类广告搜索“http://catalogs.google.com/”
这也在B测试阶段。主要是对电子分类广告做检索。广告页为JPG图片格式。
14.4,其它Google的最新发展动态
想了解Google公司的工程师们都在忙些什么吗?去看一下Google实验室
(http://labs.google.com/)吧。Google的最新设想都在这个地方向访问者展现出来。
现在处于发展和试验阶段的新功能有:术语查询、语音查询、键盘查询等等。
网络工程师和程序员可以看看这个地方:http://www.google.com/apis/,我想可以让
你喜出望外的。
14.5,一个有趣的地方
想看看世界各国网民都用Google搜索什么信息么?到
http://www.google.com/press/zeitgeist.html看一下就知道了。从这些资讯中,你大
致可以了解到世界热点和流行时尚走向。:)
15,后记
这个文章4.0版本与3.0版本相比,变更很大,主要把一些与Google无关的东西删除
了,另外随Google的变化作了一些修正,并增加了一些Google尚未发布的新功能。关
于搜索技巧和搜索实例,是各个搜索引擎共通的东西,是搜索者长期的经验积累,要写
出来,是件工程很浩大的事情,因此在这个小文章中我就不献丑了。
随着时间的推移,我发现搜索已经成为网络生活的一部分。工作需要搜索技术文档、客
户信息;购物需要搜索商品信息和指南;娱乐需要搜索相关背景资料和图片。搜索已经
变得无处不在,而Google则相应的成了工作和生活中的一个必备工具。套用雅虎的一
句广告词,我们也许应该这样说:“今天你Google了吗?”