代码改变世界

Google使用技巧(一)

  onm  阅读(409)  评论(0编辑  收藏  举报

一些基本要点

  1. 每一个字词都很重要。通常,搜索引擎会使用您在查询中输入的所有字词。(部分会被忽略,见下文)
  2. 搜索始终不区分大小写。
  3. 通常,标点符号(包括 @#$%^&*()=+[]\)以及其他特殊字符)都会被忽略。(有些不会被忽略,见下文)

关于优化搜索结果的一些提示

  1. 保持简单。大多数查询都不需要高级操作符或不常见的语法。简单就好。
  2. 考虑您要查找的网页将以什么方式编写。使用最可能出现在要查找的网页上的字词。例如,不要使用[我的头很痛],而应使用[头痛],因为这才是医疗网页会使用的字词。查询[哪些国家或地区将蝙蝠当作好运的象征?]对于人来说很清晰明了,但是包含相关答案的文档可能不会出现这样的句子。
  3. 尽量简明扼要地描述您要查找的内容。查询中的每个字词都应使目标更加明确。因为所有字词都会用到,所以每增加一个词,就会对结果多一些限制。如果您的限制过多,将会错过许多有用的信息。以较少的关键字开始搜索的主要优点在于:如果您没有找到需要的结果,那么所显示的结果很可能会给您提供很好的提示,让您了解需要添加哪些字词以便在下次搜索中优化您的结果。例如,[天气北京]是一种查询天气的简单方法,而且与更长的[中国北京市的天气预报] 相比,很可能会得到更好的结果。
  4. 选择描述性的字词。字词越独特,您越有可能获得相关的结果。在通常情况下,不要使用描述性欠佳的字词,如"文档"、"网站"、"公司"或"信息"。但请记住,如果某个字词不是绝大多数人常用的,那么即使它意思正确,也可能与您要找的网页不匹配。例如,[名人铃声]比[名人声音] 更具描述性而且更具体。

被忽略的关键字:

  1. 经常被使用的单词,像“a”,“the”常被忽略。

不被忽略的标点:

  1. 一些流行的标点,像[C++]或者[C#](都是编程语言的名字)不会被忽略。
  2. 两个具有很强关联的单词中间的连字符不会被忽略。
  3. 当连接两个词的强调符号_(下划线)不会被忽略。
  4. Google能够让你搜索近似的词——叫做同义词——通过使用“~”符号。只要在想要搜索的词之前加上“~”符号,Google就会搜索所有包括这个词以及合适的近义词的页面。例如,要搜索类似“elderly”的词,输入“~elderly”,所得到的页面就会不仅是包括“elderly”这个词,还会有包括“senior”、“older”、“aged”等等词的页面。

Google语法:

  1. 为了将搜索结果限定在只关于Monty Python喜剧团之内,也就是你想要搜索的页面是按规定的顺序,将这两个词作为一个词组包含在内的,你就应该在输入搜索要求时输入"monty python"——确保这个词组在引号之内。这样的话,如果没有按照规定的顺序将这两个次匹配为一个精确的词组,这个页面就不会被列在搜索结果当中。
  2. Google用减号“-”表示逻辑“非”操作。“A –B”表示搜索包含A但没有B的网页。示例:搜索所有包含“搜索引擎”和“历史”但不含“文化”、“中国历史”和“世界历史”的中文网页。搜索:“搜索引擎 历史 -文化 -中国历史 -世界历史”。结果:已搜索有关搜索引擎 历史 -文化 -中国历史 -世界历史的中文(简体)网页。 共约有36,800项查询结果,这是第1-10项 。 搜索用时0.22秒。
  3. 一般搜索引擎需要在多个关键字之间加上“ ”,而Google无需用明文的“ ”来表示逻辑“与”操作,只要空格就可以了。现在,我们需要了解一下搜索引擎的历史,因此期望搜得的网页上有“搜索引擎”和“历史”两个关键字。示例:搜索所有包含关键词“搜索引擎”和“历史”的中文网页搜索:“搜索引擎 历史”。结果:已搜索有关搜索引擎 历史的中文(简体)网页。 共约有78,600项查询结果,这是第1-10项 。 搜索用时0.36秒。
  4. Google用大写的“OR”表示逻辑“或”操作。搜索“A OR B”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B。在上例中,我们希望搜索结果中最好含有“archie”、“lycos”、“蜘蛛”等关键字中的一个或者几个,这样可以进一步的精简搜索结果。你也可以用 | 来代替OR。注意:“与”操作必须用大写的“OR”,而不是小写的“or”。
  5. 搜索引擎忽略的字符以及强制搜索Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。示例:搜索关于www起源的一些历史资料。搜索:“www的历史 internet”。结果:以下的字词因为使用过于频繁,没有被列入搜索范围: www 的. 已搜索有关www的历史 internet的中文(简体)网页。 共约有75,100项查询结果,这是第1-10项 。 搜索用时0.22秒。我们看到,搜索“www的历史 internet”,但搜索引擎把“www”和“的”都省略了。于是上述搜索只搜索了“历史”和“internet”。这显然不符合要求。这里我顺便说一点搜索引擎分词的知识。当我们在搜索“www的历史”的时候,搜索引擎实际上把这个短语分成三部分,“www”、“的”和“历史”分别来检索,这就是搜索引擎的分词。所以尽管你输入了连续的“www的历史”,但搜索引擎还是把这个短语当成三个关键字分别检索。
  6. 在某一类文件中查找信息“filetype:”是Google开发的非常强大实用的一个搜索语法。也就是说,Google不仅能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,Google已经能检索微软的Office文档如.xls、.ppt、.doc,.rtf,WordPerfect文档,Lotus1-2-3文档,Adobe的.pdf文档,ShockWave的.swf文档(Flash动画)等。其中最实用的文档搜索是PDF搜索。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前Google检索的PDF文档大约有2500万左右,大约占所有索引的二进制文档数量的80%。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。示例:搜索几个资产负债表的Office文档。搜索:“资产负债表 filetype:doc OR filetype:xls OR filetype:ppt”。结果:已搜索有关资产负债表 filetype:doc OR filetype:xls OR filetype:ppt的中文(简体)网页。 共约有481项查询结果,这是第1-10项 。 搜索用时0.04秒。
  7. 要查看某个字词或词组的定义,在此字词或词组前加上“define:”即可。请注意,搜索结果会提供整个词组的定义。 这个功能很好用,当你相差某个新词汇是什么意思时,Google会自动帮您连接相关资源,供您选择。
  8. inurl这个修饰语只会搜索网页的网址,不妨用这个例子试一试 inurl:spices。如果你只想查找一个网址,但却只记得部分,那么使用inurl,它会搜索URL中的内容,正如它的名字,在URL里。

其它:

  1. Google Dictionary。由于质量较数量更为重要,就可以绕过主要的Google搜索引擎而使用Google Directory来代替。Google Directory是一个网页清单相对较小的数据库,它们都是通过一个人工编辑团队手动精心挑选的。Google Directory是有被注释和组织到相关的话题类目下的。你可以通过类目来浏览网页目录,或是搜索指定的项目。
  2. 中文拼音,自动纠错功能。在Google搜索框中输入要搜索关键字的拼音,Google会自动提示您中文关键字,这个功能很好用。
  3. Google的整合搜索也很好用。比如用Google搜个电影、车票、天气什么的都很方便。计算器,你可以直接输入算式,然后Google会帮您计算出结果。
  4. Google搜索工具。Google的时空隧道功能,可以按时间进行搜索。还有神奇罗盘,提供了相关搜索。
  5. 点击Google高级搜索。大部分的语法秘籍都在这里。
参考链接:
http://www.google.com/support/websearch/bin/answer.py?hl=cn&answer=134479
http://www.williamlong.info/archives/728.html
http://www.se-express.com/article/article13.htm
编辑推荐:
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
阅读排行:
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· [AI/GPT/综述] AI Agent的设计模式综述
点击右上角即可分享
微信分享提示