《文献管理与信息分析》第二章

科研工作者需要有信息素养,在学习之前首先得找到要学习的信息,所以一个人的学习能力很大程度上取决于信息搜索能力。本节课主要讲述信息搜索。

信息获取依赖于资源和方法,我们可以查找图书类(时效性差,品种较少,无法赶上快速发展社会的需要)、使用搜索引擎(快速、高效)、通过社交网络进行询问(需要一定量的粉丝)、阅读推送的信息(如RSS定制)。我们需要建立搜索意识(搜索使用的好与坏关系学习和工作能力),掌握基本的搜索技巧(基本检索、高级检索、取词、优化、反推、转换等)、掌握利用搜索引擎解决问题的思路 。

搜索引擎并不直接搜索网络,而是搜索已经建立的索引。不同的搜索引擎爬取的范围和数量不同,索引的方法不同,搜索引擎的异同,反馈的结果数量不同,排序的方式不同,交互的功能不同,结果的呈现方式不同。搜索有三种境界,分别是搜索引擎的使用入门,搜索进阶(基本逻辑关系),高效搜索(搜索命令的使用)。Google 收录范围最广,提供多种精炼功能;百度中文收录最大,广告多;360收录结果偏少,但质量相对较高(可以看到用户对网站的喜爱程度)。

Google 的 search tools 这项功能挺有意思,针对新闻、图片、视频有不同的选项,比如可以查找指定颜色的图片,类型为人脸的图片:

Google 搜索命令(组合利用功能更加强大):

  • AND、OR:必须大写,否则会被认为是普通的单词。AND指令一般以空格代替,还可以用+代替。OR指令用|代替(OR优先于AND)
  • - (逻辑非)
  • "…" 代表完整匹配,搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配
  • * 代表多个字符, ? 代表单个字符
  • site: 在某个网站或域名下搜索。如 “区块链 site:pku.edu.cn”命令可以查看北京大学对区块链的研究。又如 site:cnblogs.com 表示在博客园上搜索相关内容。在Google和百度中输入相同代码,发现二者的搜索结果还是有很大区别的......

  • filetype: 搜索某种类型的文件。如 filetype:pdf 表示只搜索 PDF 文档
  • intitle: 在网页标题中查找。allintitle 返回结果将返回在标题中同时包含所有搜索项的网页。如 allintitle:blockchain finance = intitle:blockchain finance
  • inurl: 搜索查询词出现在 url 中的页面
  • inanchor: 搜索查询词出现在链接锚中的页面,返回的结果页面本身并不一定包含查询词(inurl是网页本身的url地址,而inanchor是在外部用于指向该url地址的文本(之间文本)中找)
  • intext: 在正文中检索
  • link: 搜索所有链接到某个url地址的网页,可以迅速判断一个网页的“热度”
  • related: 寻找某网页的“相关”网页。相关一般指的是有共同外部链接的网站

此外,按图片搜索可以帮助我们判断网上信息的真实性,搜索风云榜(后加trends)可以了解某个关键词被搜索的情况,可以按时间、地域进行统计。

posted @ 2018-01-26 16:49  20179202杨晓桐  阅读(590)  评论(0编辑  收藏  举报