如何通过Google查找专业文献资料 [转]^_^!!
2007-03-31 19:32 flyingfish 阅读(1442) 评论(1) 编辑 收藏 举报第一讲
推荐先读读google从入门到精通等文章.
我们了解常规搜索方式,但每个人都会搜索出不同结果,为什么?核心问题在于关键词选择不同。关键的分析必须保证两点:一是专业性,即这个词是很精的,可能简化你的搜索结果,因而词甚至可以怪一点,尽量避免大众化的词,如net,site等。即使需要大众化词,如password,username,但若加入一两个特征词,则结果将大大简化。二是具有代表性,也即这个词具有代表意义,也即它在包含你所需网页内,它在出现的可能,以免一些有用信息被遗漏。
如何达到上述两个要求?我们必须分析网页中字词出现的特点,以及本学科专业词汇特征。
大家看看yahoo,google等medicine和science--biology条目下的分类,发现许多相关的词均在内,如
http://libinfo.uark.edu/eresources/eresources.asp 医学有关的都在Science & Technology 大条目下,又细分为:
Agriculture & Food │ Biology │ Botany │ Chemistry │ Computer Science │
Engineering │ Environmental Dynamics │ Geology │ Kinesiology │ Mathem
atics │ Medicine │ Nursing │ Physics │ Psychology │ Statistics │ Zoology。
因此如果仅以medicine检索,就会漏掉不少很有价值的信息,特别是漏掉的专业的。其次,在medicine下又有很多数据库,如:EBSCO OVID,PROQUEST还有各大出版社自己的万能密码。
第二讲
主要讲定点搜索和遍搜索的区别及应用。所谓定点搜索,即指定找某个数据库相关信息,或某篇文章。遍搜索是指在网上任意逛逛,找些pswd,或者无心插柳柳成荫。
(1)定点数据库和期刊搜索。还是同第一讲一样,主要分析关键词的选择。当然关键词之一是这个数据库的名称。大家注意了:数据库名称一定要用全称和简称都试试。关键词之二是free,ID,password,user name。为什么这个关键词?其实这些只能称作是一个关键词,因为它们具有同性或不相容性。如elservier数据库,你最好不要用username和 password,因为它主要是采用IP限制的。因而你的重点放在pxory!而不是上述的任何一个。而找某一杂志,则多用user name 和ID/password合用(注:ID/password只可用一个!),因为杂志往往个人购买,便拥有帐号了。关键词三:这些数据库可能出现的地方?大学图书馆最多!即使是杂志,图书馆也较个人帐号多。那么图书馆主页上有哪些关键词?library,database,trial,free....,可看看国内一些图书馆的主页,仔细分析比较,便能找到一些共性的东西。
(2)定点文章搜索。文章,在国外通用PDF格式,因而文章搜索必须用PDF这个核心内容。即找后缀为
PDF 的东东,语法:filetypeDF 这是关键之一.关键词之二:找你所需文章的题或文摘中最怪的词!而不是常用省#ú灰煤?专业的词往往能找到相近的文章,所谓无心插柳了)命中率高,但最好是题目中出现的词,为什么?因为往往许多个人站点收录了不少文章,而这些文章往往是以题目名称作为索引的。
第三讲
专业文献搜索技巧
1 查找某本专业刊物的登录密码,如Brain Res首先选关键词:杂志名(Brain Res),登录(sign in),密码(password)这样成功率并不高,其实细细看来,不应有登录,因为许多提供密码的地方,并不出现登录这个词,而多出现用户名(user name),而且杂志名多用全称(brainresearch),再试试!哦,成功了!
2 查找某篇文章的全文,尤其是外文文献,许多全文服务均需收费。当然可先按第一种方法搜索一下,看看有无密码可寻,若无,则找到该篇文章的特殊字段(key words),然后搜索PDF文件。不过这有几个条件,一是该杂志确已上网,有明确地址,其二,一般需在1997年以后文献才可。
举例:Gattullo D, Pagliaro P, Marsh NA, Losano G。New insights into ni
tric oxide and coronary circulation.Life Sci 1999;65(21):2167-74。
这篇文章是收费的。采用:inurldf:Gattullo Pagliaro coronary,结果24项,
找到其中的第2页,有下面一项Life Sciences [Volume 65, Issue 21, Pages 2
167-2268 (1999)]
... 1. New Insights into Nitric Oxide and Coronary Circulation, Pages
2167-2174 D. Gattullo, P. Pagliaro, NA Marsh and G. Losano 2. ...
147.46.94.112/journal/sej/j_l/l339.htm - 14k - 网页快照 - 类似网页
打开网页快照,第一篇即是其目录,下载即可!OK!成功
2 查找专业软件的***软件或注册码
常规软件的注册码很好找,但专业软件太少,而且注册码也少,***更少,如何找?
如找origin 6.1版的***版,或注册码。不管采用网易、搜狐等软件搜索,均找不到该软件。那么只好借用特殊搜索了。
分析:一般有些***软件的页面一般至少有以下一些信息:软件名称,版本,序列号(serial number, OR sn),***(crack, OR CRK),提供下载的地方有.ZIP字样(压缩文件为多)。为了方便起见,也防止版本太精确反而不易搜索的特点,在googlek 输入origin ***, 哦!OK!成功!如果其它的软件一次搜索的结果太多的话,则考
虑加6.1以减小其搜索范围。或搜索结果太少且不是需要的话,将***换为"注册码"试试,一般效果不错。
3 查找中文文献的免费全文
如我知道重庆维普提供免费全文服务,但目前许多站点都不能用了。另外,还有万方数据库、CNKI也提供,那么我如何查到这些数据库的免费入口呢?这需要一定的技巧,采用google或百度试试:输入:重庆维普 密码
哦!66项!仔细找一找,必有结果!OK!
第四讲
这一讲讲百度与google比较
搜索英文不必说用google,搜索中文呢?
很多人并不了解它们更新的情况,google发展早,因而它贮存了大量旧的信息,百度发展迟,信息较新。更新速度:对中文google一般半月至一月一更新,而且仅搜索到三级链接,三级以下便不在搜索,那么我如何看到最新的google搜索的结果呢?这个站点:http://www3.google.com/,可见google采用不同服务器逐步更新的。百度的更新较快,半月一次,最快一周。那么如何衡梁这半月与一月的差剧与价值?对于一些试用数据库,有效期短,或象万方等一月一换密码,最好选用百度,现在维普老是打一枪换一个地方,因而也只好用百度了,google往往搜索出来的结果已过期了。而能长期使用的密码或数据库,一般象国外的(国内有没有,我真不知道),最好用google,毕竟技术更老道一些,搜索出的结果更多,更广!
第五讲
关于关键词
关键词组合:
nurse journal password
new medicine password
What's New medicine password
périodiques électroniques password( 注意了,不是英文字母样!)
biomedical library password
LWW Journal Collection password
Bibliotekets databaser password
Kluwer Online password
journalwebsite password
基本路子仍是数据库+password+补充性关键词(或称定向性关键词)
所谓定向性关键词是将你的检索范围定于某一可能的区域,如图书馆、个人站点,以缩小检索范围。如单个杂志,可定位于个人,若是数据库检索,则宜加 library,因为个人是不会买数据库的。同时另一个定向是生物和医学,所用的关键词medicine,biology,biomed.当然仍可加第三定向关键词,如杂志(journal)、免费(free)、在线(online),但一定要注意第三关键词的特征性不强,要选择使用,不可过用,否则会将一大批可能有用的站点排除掉,切记!但这主要针对国外的,而国内的一般多在各大学图书馆内,常用密码、免费、杂志、数据库名等搜索,效果较好。但对于有些杂志,如sciencedirect,Ideallibrary多采用IP验证方式,一般密码并不能用,这时多采用代理服务器方式,因而如何找到有效的代理太重要的。如清华的elsevier便是代理。
第六讲
本讲讲关键词联合使用。
国内图书馆提到数据库往往只提***数据库,而国外图书馆多列出该数据库内各种杂志名,而且多按字母分类。因而为了提高检索的准确率,一般将同一数据库内的杂志的首字母相同的杂志名用两到三个联合搜索,再结合前面讲的加用其它关键词,能有效缩小检索范围,翕中率极高。从这里可以看到,如果透彻分析一些图书馆内主页设计的特征,是搜索的关键。如检索brain research,可列出brain research bulltin,同时检索,效果要好些
。
第七讲
搜索代理服务器技巧:
中文:代理 维普(或其它数据库名) 数据库,能找到一些,但国内一般真正使用代理的较少。
英文:proxy 数据库名 IE netscape效果非常好,但一定要注意,许多地方不仅用代理服务器,而且需密码认证,不可过于乐观!应认真鉴别。
第八讲
找特定文件名的文件,尤其是PDF、ZIP、DOC、TXT、RAR、EXE、RM、Mp3,MOV这些文件名都是大家想找的重点,至于各是什么类型文件,请上网查一下便知道了,这里不多说了。方法是利用语法filetype:后缀名。
如找PDF文件,在正常关键词后面加filetypeDF即可,搜索结果全是PDF文件。
这是我写的另一篇,可参考:http://bbs.bioon.com/bbs0......& ... p;ID=839&page=1
找特定题目的网页语法intitle:网站查找友情链接:"link:"(英文单字link后加冒号)用于搜索链接到某个URL地址的网页。可以了解有哪些网页把链接指向您的网页查找特定站点:
site: www.*.com如 金庸 古龙 site:sina.com.cn但不可加入http://或/这类,否则是错的cache”用来搜索GOOGLE服务器上某页面的缓存,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。
示例:查找GOOGLE缓存的中文yahoo首页
搜索:“cache:http://www.yahoo.com.cn”
info用来显示与某链接相关的一系列搜索,提供cache、link、related和完全包含该链接的网页的功能。
示例:查找和新浪首页相关的一些资讯。
搜索:“info:http://www.sina.com.cn”
结果:http://www.sina.com.cn的网页信息。
示例:查找美国教育网上的宇宙大爆炸jpg图片
搜索:“BIG BANG filetype:jpg site:edu”
结果:搜索有关 BIG BANG filetype:jpg site:edu 的图片
第九讲
专讲一个特殊语法,很有用。inurl
“inurl” 语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。 INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。
示例:查找MIDI曲“沧海一声笑”。
搜索:“inurl:midi 沧海一声笑”
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。
示例:查找微软网站上关于windows2000的安全课题资料。
搜索:“inurl:security windows2000 site:microsoft.com”
结果:已在microsoft.com内搜索有关inurlecurity windows2000 的网页。
注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。例如,GOOGLE会把“cgi-bin/phf”中的“/”当成空格处理。而一般众多密码或数据库往往出现在链接之中,如查Ideallibraryinurl;ideallibrary proxy passowrd(ID)
“allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字
只集中于网页的链接字符串。
示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGI-BIN目录中含
有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/ph
f”。
语法:“allinurl:"cgi-bin" phf +com”
搜索:已向英特网搜索allinurl:"cgi-bin" phf +com. 共约有37项查询结果,这
是第1-10项 。 搜索用时0.36秒。
第十讲
代理:
国外的数据库,许多需代理,如何搜索到?普通的代理遍地都是,只要用google输入proxy free或代理服务器 免费就能搜索到非常多的代理,但这些代理并不适用于查阅一些著名数据库,好么如何找到?一般有以下几点技巧,我并作简要分析:
由于这些代理必须要出现于大学内。
(1)因而如果采用普通的免费代理,则必须保证这种代理在某个大学,这可通过代理测得,其中无特别的技巧。可见下面一个代理服务器帖子的说明(2)如果要搜索,则应该将代理服务器限制于大学内,因而其搜索格式应该如下:
proxy 数据库名 site:edu
这是标准格式,搜索的数据库较多,但一定注意并不等于搜索出的代理都有用,有些代理还需密码支持,仔细判定。其它类似可选关键词也列一些,与上述核心关键词适当组合便可,提高搜索准确率:
Off-Campus:能提高无密码搜索成功率
netscape:能提高准确率
第十一讲
用google 查密码。大多数人用google,仍未能对google有深入地了解。往往用google搜索出大量密码,一用才知道都过期了,尤其是中文的密码,现在更新极度频繁,如何能查到最新的密码很重要。在前面几讲我讲过百度的更新较google快,然而百度对链接分析能力较google差, google能分析到下四层链接,而百度可能只能至第三层,而往往密码出现的位置:大学主页--图书馆---电子数据库---某些数据库密码,从这个分析可以看到,许多密码都出现在主页的第四层下面,百度往往搜索不到(当然第三层也有很多,这是百度长处之一)。因而搜索中文密码google仍很重要,那么如何用最新的google?google的中文数据库一月一更新(太慢了,英文的一天一更新),但 google在全球有数千台服务器,它们对各种语种更新的速度是不同的。并且更新方式采用梯度更新,即先更新某些服务器,后来全面更新。因而我们能利用 google最新的服务器搜索,而 goole最新服务
器的链接在这里:http://www3.google.com.