文献数据库基础知识
1 国际知名的权威学术出版社/会议组织者
1.1 IEEE(Institute of Electrical and Electronics Engineering)
- 简介:IEEE是出版社和会议组织者,既组织学术会议,也出版学术期刊,IEEE出版社有自己出版的文献数据库,而网站IEEE Xplore就是查询该出版社文献数据库的入口。对应的(全文)文献数据库(查文献网址):IEEE Xplore。
1.2 Springer(Springer-Verlag)
- 简介:德国斯普林格(Springer-Verlag)通过SpringerLink系统提供其学术期刊及电子图书的在线服务,该数据库包括了各类期刊、丛书、图书、参考工具书以及回溯文档。 对应的(全文)文献数据库(查文献网址):SpringerLink。
1.3 Elsevier
- 简介:作为世界上最大的医学与其他科学文献出版商,爱思唯尔旗下出版2500余种期刊,包括具有高影响因子的《细胞》(《Cell》)和《柳叶刀》(《The Lancet》)这两大国际顶尖学术期刊。每年,爱思唯尔公司出版的期刊共发表约35万篇论文,同时爱思唯尔还提供世界最大的摘要和引文数据库Scopus。对应的(全文)文献数据库(查文献网址):Elsevier。
1.4 Taylor & Francis
- 简介:以出版科技书籍与参考书著称,在人类工程学、地理信息系统、建筑、土木工程、物理和生物技术等领域尤为突出。对应的(全文)文献数据库(查文献网址):Tandfonline。
2 文摘/索引数据库
世界著名的三大期刊文献检索工具,SCI、EI、CPCI-S,它们也是国际公认的进行科学统计与科学评价的主要检索工具,其中 SCI 最为重要。
上面介绍了出版社和它们的文献数据库,现在说的 SCI、EI、CPCI-S 也是数据库,它们是引文数据库。文献数据库有该出版社的论文的全文,而引文数据库只有收录的文献的一些公开信息(题目、作者、摘要、参考文献等)。你在引文数据库只能找到论文的一些公开信息,想下载全文还得到出版社的文献数据库。
引文数据库有点儿像豆瓣,我们能在豆瓣上看到某电影的相关信息,但要看电影还得跳到具体的视频网站(文献数据库)。
各出版社有了自己的文献数据库,为什么还要有引文数据库呢?
简单理解,这些出版社的文献的数据库是相互独立的,这时候用一种方法把它们整合到一起,在一个数据库就能搜到某一方向有哪些文献(各个出版社的)。但不是所有的出版社的都收录,不是每篇文献都有一样的权重,怎么整合需要采用一定的规则。比如SCI通过论文的被引用频次等的统计,对学术期刊和科研成果进行多方位的评价研究,从而评判一个国家或地区、科研单位、个人的科研产出绩效,来反映其在国际上的学术水平。被SCI收录的论文就称为SCI论文,被EI收录的论文称为EI论文。SCI一般会去收录高质量的期刊的文章,高质量的会议的文章,EI 会收录的更多一些,因为水平低一点的文章他也收录了。
2.1 SCI(Science Citation Index)
- 简介:由美国科学信息研究所(ISI)1961年创办出版的引文数据库;SCI 既是检索工具,也是引文数据库。对应的引文数据库(查文献网址):Web Of Science。
- 注意:SCIE 是 SCI 扩展版,二者在选刊上并没有什么本质的区别,只是收录的期刊数不同。随着网络版的普及,SCIE就是SCI,慢慢趋于通用,它们都是指Web of Science平台上的SCI-Expanded数据库,大学图书馆买的SCI数据库名称一般就为 SCI-E。
2.2 EI(The Engineering Index)
- 简介:由美国工程信息公司出版,报道工程技术各学科的期刊、会议论文、科技报告等文献。对应的引文数据库(查文献网址):EngineeringVillage。
2.3 CPCI(Conference Proceedings Citation Index)
- 简介:汇集了世界上最新出版的会议录资料,包括专著、丛书、预印本以及来源于期刊的会议论文,提供了综合全面、多学科的会议论文资料,对应的引文数据库(查文献网址):Web Of Science。
2.4 国内外常见数据库
-
外文引文数据库
- Science Citation Index, SCI
- Social Sciences Citation Index, SSCI
- Arts & HumanitiesCitation Index, A&HCI
- Emerging Sources Citation Index
- Conference Proceedings Citation Index, CPCI
- The Engineering Index, EI
- Chemical Abstracts, CA
- JST(日本)、AJ(俄国)、ISR
-
中文引文数据库
- 中国科学引文数据库, CSCD
- 中文社会科学引文索引, CSSCI, (南大核心)
- 中文核心期刊要目总览, (北大核心)
- 中国科技论文统计源期刊, CSTPCD
- 中国人文社会科学核心期刊, CHSSCD
- 中国人文社会科学核心期刊
- 中国核心期刊遴选数据库
3 基础知识辨析
3.1 会议组织者、出版商、科研工作者的关系
会议组织者:可能是某个学校;也可能是某个组织;他们为学术/经济利益举办会议,从科研工作者处收文章,收注册费;然后将论文集扔给出版商;
出版商:具备一定声望,比如Elsevier/IEEE/Springer,其旗下有一些会议论文的项目,如Elsevier的Procedia(新推出的),IEEE的Conference Program,Springer的Lecture Notes系列;
这些会议项目的共同特点是:
1.拿论文的版权;
2.向会议组织者收取出版费用(比如每100篇多少钱);
3.会把论文放在自己的数据库里面,比如ScienceDirect,IEEExplorer等等;
收录:比如我建立起来了一个数据库叫 RabbitPaper,我可以自己抓取一些公开的数据,比如 IEEExplorer / Lecture Notes上面能找到的所有关于Rabbit的文章,我把所有的题目+摘要+参考文献,全扣下来放在我的数据库里面,那么我可以宣传说:我这个 Rabbit数据库里面收录了重要关于Rabbit的文献;
我不持有IEEExplorer / Lecture Notes的全文内容,只是抓取了公开的信息而已;
检索:“检索”本身的意思是“在某个数据库里面发现某种内容”;检索工具有很多,Google/Google Scholar/Scirus/ScienceDirect/IEEExplorer/ISI这些都是检索工具;
- 检索工具可能能帮你拿到论文的全文(比如Elsevier的Procedia的全文就是免费公开的,很方便下载);
- 也可能不能帮你拿到全文(比如IEEExplorer是收费的,LNCS也是收费的),需要有权限才能下载全文;
3.2 SCI和EI是什么
3.2.1 SCI是什么
SCI(Science Citation Index)是ISI(Institute Scientific Information)做的数据库,其特点为:
- SCI不是出版商,只是数据库,不是具体某篇文章内容版权的拥有者;所以在SCI里面,能看到只是题目+摘要+参考文献;
- SCI自己有一个自己确定的期刊列表,SCI只是从出版商处抓取某些期刊的 论文里面的信息(题目/作者/摘要/参考文献),然后可能添加一些自己的信息,比如分类号一类的东西;
- SCI的内容不是原始文献全文,卖点是每年推出JCR,里面给出影响因子。
- “SCI全文收录”这个短语就是扯淡。。。因为SCI里面哪有全文啊。
3.2.3 EI是什么
Engineering information Inc.,现在隶属于Elsevier旗下;大家常说的EI Compendex 收录论文的题录、摘要,并加个主题词、分类号什么的。
- EI只是从 出版商处抓取某些期刊的论文里面的 信息(题目/作者/摘要/参考文献)。
- “EI全文收录”这个短语就是扯淡。。。因为EI里面哪有全文啊。
3.3 ISI、SCI 、汤森路透、路透社的关系
SCI是由美国科学信息研究所(ISI)1961年创办出版的一部世界著名的期刊文献检索工具,其出版形式包括印刷版期刊和光盘版及联机数据库,现在还发行了互联网上Web版数据库。
ISI通过它严格的选刊标准和评估程序挑选刊源,而且每年略有增减,从而做到SCI收录的文献能全面覆盖全世界最重要和最有影响力的研究成果。40多年来,SCI数据库不断发展,已经成为当代世界最为重要的大型数据库,被列在国际六大著名检索系统(SCI,EI,CA,SA,AJ/РЖ,JST)和三大检索工具(SCI,EI,ISTP)之首。它不仅是一部重要的检索工具书,而且也是科学研究成果评价一项重要依据。在我国,经国家科学技术部有关部门和领导研究,决定从2000年的统计工作起,SCI论文统计用检索系统改为用SCIE。也就是说:如果某位作者的论文被2000年版以后的SCIE收录,就算是被SCI收录了。
美国科学信息研究所(Institute for Scientific Information, 简称ISI)于1960年由Eugene Garfield创立。1992被加拿大汤姆森公司(The Thomson Corporation)的分公司Thomson Scientific & Healthcare收购,于是就成了现在有名的Thomson ISI。后来这个分公司在2006年又分为Thomson Scientific and Thomson Healthcare两个子公司。
至于现在的汤森路透(Thomson Reuters),网址http://thomsonreuters.com/,成立于2008年4月17日,是由Thomson公司与英国路透集团(Reuters Group PLC)合并组成的商务和专业智能信息提供商。现在的路透社只是其新闻业务的一部分。以下就介绍一下Thomson Scientific的SCI相关的产品。
(1) ISI web of knowledge
Thomson Scientific网络平台。收费的,通过http://apps.webofknowledge.com登录进入,或通过你所在学校图书馆或机构网站提供的入口进入。该产品是汤森路透公司的online学术服务产品,它包含了子产品 “web of science”数据库以及其他资源。Web of science数据库就是我们平时检索SCI数据时所使用的网页,除SCI数据库外,Web of science数据库还包含另外的6个数据库:SSCI,AHCI,IC,CCR,CPCI:Science和CPCI:Social science and Humanities。
(2) Master Journal List
是免费的,汤森路透公司提供的ISI收录的期刊总列表。包括SCI,SCI-E,AHCI,SSCI,CC等众多索引数据库收录的期刊的信息。现在ISI收录的期刊总数是16415个。其中SCI 3772个,SCI-E 8198个。
- SCI从来源期刊数量来看可分为SCI和SCI-E。
SCI是指来源期刊为3772种左右的SCI核心区期刊,
SCI-E的全称是SCI-Expanded,是SCI扩展版,其来源期刊8198种左右。
SCI-E包括SCI中的期刊。
(3)Journal Citation Reports
美国科学情报研究所(ISI)大概每年6月份公布上一年的期刊引用报告(Journal Citation Reports on the Web, JCR Web),JCR对包括SCI收录的SCI-Expanded(包括SCI核心区期刊)的期刊之间引用和被引用数据进行统计、运算,并针对每种期刊定义了影响因子(Impact Factor)等指数加以报道。
JCR可以告知用户的信息包括:每种期刊在当前年被引用的总次数(Total Cites)、每种期刊的影响因子(即该刊前两年发表的文章在当前年的平均被引次数(Impact Factor))、每种期刊当前年发表的文章在当前年的平均被引次数(Immediacy Index)、每种期刊当前年的文章总数(Articles)、每种期刊论文研究课题的延续时间(Cited Half-life)、每种期刊的引用期刊列表(Citing Journal)、每种期刊的被引用期刊列表(Cited Journal)、每种期刊的影响因子在近几年的变化情况(Trends)、每种期刊的来源数据情况(Source Data)等。
Thomson Scientific 还有许多著名的产品。如EndNote 和 Science Watch等。
3.4 SCI分区
在中国,SCI有两种分区:一种是JCR分区;另一种是中科院分区。在国外,基本不存在分区概念,这只是一个参考,他们一般只投本学科权威期刊,不管分区的,但这些权威期刊一般影响因子都很高。
3.4.1 两种分区方法
(1) JCR分区
JCR将收录期刊分为176个不同学科类别,每个学科分类按照期刊的影响因子高低,平均分为4个区:
- 影响因子前25%(含25%)的期刊为Q1区;
- 影响因子位于25-50%(含50%)为Q2区;
- 影响因子位于50-75%(含75%)为Q3区;
- 影响因子位于75%之后的期刊为Q4区。
(2) 中科院分区
中科院首先将JCR中所有期刊分为数学、物理、化学、生物、地学、天文、工程技术、医学、环境科学、农林科学、社会科学、管理科学及综合性期刊13大类。然后,将13大类期刊分各自为4个等级,按照各类期刊影响因子划分,4个区:
- 前5%为该类1区;
- 6%~20%为2区;
- 21%~50%为3区;
- 其余的为4区。 可以发现中科院完全使用JCR的影响因子数据,只是进行了不同的学科划分。今年中科院进行了改革,分区表分为基础班和升级版,比往年更加合理一点。
3.4.2 两种分区比较
(1) 学科划分不同
科睿唯安JCR的Journal Ranking没有设置大类学科,只分为176个具体学科,也就是中科院分区表中所指的小类学科。
(2) 分区方法不同
JCR是按照“平均主义”思想,根据刊物IF的高至低平均划分4个区,每个区含有该领域总量25%的期刊;中科院的分区如同社会阶层的金字塔结构,1区只有5%的顶级期刊,2~4区期刊数量也逐层增加。
(3)指标取值不同
JCR是按本年度公布的IF进行分区,中科院是按期刊前3年IF的平均值进行分区。
3.4.3 我们到底该看哪个分区
由于中科院分区备受争议,现在很多高校已经不用中科院分区了,虽然在今年中科院进行了改革,分区表分为基础班和升级版,但依然无济于事。 我认为JCR分区可以作为参考,不可SCI至上,因为数据是可以操纵的。
4 资料链接
https://lib.tsinghua.edu.cn/__local/4/D6/C7/A4DC654D5B4D658CF131335DE9C_9EECFA6B_1E48B8.pdf?e=.pdf