信息检索与论文写作
鄙以为,作为一名计算机人,其核心能力是自学能力,其自学能力的基础是信息检索能力。为此,在本学期学习信息检索这门课程的时候,我想着十分有必要对信息检索的知识进行归纳总结。本文章的内容主要分为:学术检索资源、搜索引擎高级搜索方法、论文写作三部分。
一、信息检索概述
1.1 信息检索是研究问题、解决问题的基础
随着现代信息技术的迅猛发展,信息已经渗透到社会的各个领域,并发挥着越来越重要的作用,它已成为现代社会经济生活中不可缺少的重要资源。人类社会正迈人信息社会时代,信息深刻改变着人们的学习和生活方式。面对信息数量的剧增、信息质量的良券不齐,人们在纷繁复杂的信息中如何快速地获取与有效地利用信息来促进个人知识的不断增长,取决于信息素养的全面提高。因此,具备一定的信息素养已经成为个人适应信息社会的必要条件。作为一种综合能力的具体体现,信息素养不仅关乎个人在信息社会的生存与提高,同时也关系到整个人类社会的进步与发展,因此,信息素养及信息素养教育越来越受到重视。1998年,教育部在其颁布的《普通高等学校本科专业目录和专业介绍》中,对每个本科专业的培养目标都添加了“掌握文献检索、资料查询的基本方法,具有独立获取知识信息的能力”这项要求。目前,大部分高校也都将信息检索列为公共基础课程,目的是培养学生的信息素质,使学生在增强信息意识的基础上,熟悉检索工具和系统,掌握信息检索的方法和技巧,以提高学生研究问题和解决问题的能力。
大数据时代,信息、数据与智慧是制胜的法宝。本文章教授异构大数据中知识信息的检索、挖掘、存储、处理和分析方法。通过本文章的学习,了解知识资源检索的基本理论,专业信息资源概况;掌握精准获取和利用信息资源的基本技能;能自如地利用大数据文献资源进行信息挖掘、分析和数据处理。
1.2 数据=> 信息 => 知识 => 智慧(待完善)
二、学术检索资源
2.1 核心期刊体系
2.1.1 核心期刊体系与文索引系统 & 布拉德福文分散定律
2.1.2 核心期刊的特点
2.1.3 核心期刊的评价(指标)
2.1.3 评价指标:影响因子(IF)
IF指某期刊前两年发表的文章在统计当年平均被引用次数
影响因子IF= (某期刊前两年发表论文在统计当年被引用的总次数) /(该刊前两年发表论文总数)
2.1.4 评价指标:H指数
期刊h指数:对于一种期刊,如果它发表的全部论文中有h篇文章每篇被引用数至少为h,同时要满足h这个自然数为最大,那么该值即为该期刊的h指数(Braun,2006)
H指数巧妙地将期刊的数量指标与质量指标巧妙地结合在了一起。克服了其他指标的单一评价方式的缺点。
一般地,IF与期刊H指数结合使用。
2.2 国内核心期刊评价体系与索引系统
国内有7大核心期刊(或来源期刊)遴选体系:
1) 北京大学图书馆《中文核心期刊》
最普及的,也广为人知,但在影响力上,是除南大核心、中国科学引文数据库(CSCD)以外学术影响力最权威的一种。而在职称晋升中,一般更加认可北大核心期刊。
2) 南京大学《中文社会科学引文索引(CSSCI)来源期刊》
3) 中国科学技术信息研究所《中国科技论文统计源期刊》(CSTPCD,又称“中国科技核心期刊”)。
4) 中国科学院文献情报中心《中国科学引文数据库来源期刊(CSCD)》。
5) 中国社会科学院文献信息中心《中国人文社会科学核心期刊要览》,。2000年推出首版,建有《中国人文社会科学引文数据库》(CHSSCD)。
6) 武汉大学《中国核心期刊目录》(RCCSE),由武汉大学邱均平教授主持研制。
7) 清华大学图书馆 + 中国学术期刊(光盘版)电子杂志社《中国学术期刊综合引证报告》。每年发布;建有《中国引文数据库》(CCD)。
如果该期刊同时被两种核心期刊遴选体系认定为核心,那么该期刊就是双核心期刊了。
2.2.1 国内主要核心期刊评价体系和索引系统:北京大学图书馆《中文核心期刊要目总览》
北大核心期刊:又称中文核心,北大核心。核心期刊定量评价,采用了被索量、被摘量、被引量、它引量、被摘率、影响因子、获国家奖或被国内外重要检索工具收录等7个评价指标,是在所有科技核心期刊中每4年评选1次,影响因子达到标准,即可成为中文核心,由北大出版社每4年公布一次,现在用的是2017年版。
北京大学图书馆《中文核心期刊要目总览》
- ...
- 北京大学《中文核心期刊要目总览》(2020年版)
- 北京大学中文核心期刊目录(第九版 2021~2023年适用)
- ...
2.2.2 国内主要核心期刊评价体系和索引系统:中国科学院文献情报中心《中国科学引文数据库(CSCD)》
CSCD指的是中国科学引文数据库,主要负责收录我国数学、物理、化学、天文学、地学、生物学、农林科学、医药卫生、工程技术和环境科学等领域的核心期刊。
CSCD中分为核心库和扩展库, C库代表核心,E库为扩展版,其中核心库的杂志等级略高些(相对而言)。
核心库的来源期刊经过严格的评选,是各学科领域中具有权威性和代表性的核心期刊。
扩展库的来源期刊也经过大范围遴选,入选者是我国各学科领域较优秀的期刊。
此外,中国科学引文索引数据库(CSCD)还是:中国科学院院士推选人指定查询库、自然基金委国家杰出青年基金指定查询库、第四届中国青年科学家奖申报人指定查询库、自然基金委资助项目后期绩效评估指定查询库、自然基金委国家重点实验室评估查询库。
http://sdb.csdl.ac.com
值得注意的是,CSCD还提供了来源文献检索、引文检索2种引文索引检索方式。
2.2.3 国内主要核心期刊评价体系和索引系统:中国科学技术信息研究所《中国科技论文统计源期刊》/中国科技核心期刊
2.2.4 国内主要核心期刊评价体系和索引系统:南京大学《中文社会科学引文索引》(CSSCI)
CSSCI也提供2种引文索引检索的方式:
1) 来源文献检索
2)被引文献检索
2.2.5 国内主要核心期刊评价体系和索引系统:中国社会科学院文献信息中心《中国人文社会科学核心期刊要览》
2.2.6 区别:CSCD vs. 北大核心
1、收录学科范围不同
cscd和北大核心收录的学术期刊学科范围不同。cscd是只收录国内的自然科学领域期刊,北大核心除了收录自然科学领域期刊之外,还会收录人文社科领域的期刊。即北大核心期刊学科范围比cscd广。
因此,理工科的学术论文,可以发cscd,也可以发北大核心。而文科的学术期刊,不太适合发cscd。
2、等级不同
A、B、C、D是国内个单位常见的划分期刊等级的类别,等级是A>B>C>D。虽然不同的单位,这四类划分期刊的标准并不完全一致,但cscd和北大核心所属类别往往是不同的。一般来说,cscd属于B类期刊,北大核心属于C类期刊。
3、认可度不同
cscd的认可度高于北大核心,发一篇cscd要比发北大核心更好用。比如在某单位评职称,可能只认可cscd不认可北大核心,也可能cscd的加分比北大核心多。
4、发表要求不同
国内核心期刊,不仅对论文有着较高的要求,而且对作者也有身份的限制。关于论文的要求,我们可以根据具体刊物的投稿指南进行了解。相对来说,cscd的要求比北大核心更高一些。关于作者身份的限制,基本上都是本科院校/硕士学历/讲师起步。不过,理工发北核,高职理工院校、企事业单位也可以发。
另外,不想在选刊上耗费太长的时间,或者想要快速匹配合适的核心期刊(SCOPUS/EI/SCI/ISTP/CPCI/SSCI | CSCD、北大中文核心、CSSCI),可以找期刊相关机构咨询、推荐。
2.3 引文索引( For CSCD)
2.3.1 引文索引的功能
- 在某一学科领域内,哪些期刊学术影响力最大;
- 某一种期刊被引用了多少次;
- 某一种期刊出版后多久被引用;
- 某一种期刊引用其他期刊多少次;
- 帮助科研人员确定相关领域的核心期刊并发表论文,提高论文知名度,让更多的同行专家了解评价论文:
- 帮助期刊编辑与同类刊物相比较并评估本刊的地位,从而确定本刊的编辑和出版策略;
- 帮助科研管理人员科学地评价期刊,为开展期刊评比和择优资助提供决策依据;
- 帮助科学计量学家开展期刊评价研究、文献老化研究、和学科评估。
2.3.2 来源文献检索
2.3.3 引文检索
二、信息检索资源(节选)
50 超星 http://www.chaoxing.com
51 国家知识产权局 http://www.sipo.gov.cn
52 国家标准化管理委员会 http://www.sac.gov.cn
53 国家专利检索系统 http://www.pss-system.gov.cn/sipopublicsearch/portal/uiIndex.shtml
54 国家标准化检索系统 http://www.sac.gov.cn/SACSearch/outlinetemplet/gjbzcx.jsp
55 中国标准信息服务网 https://www.sacinfo.cn/
56 全国标准信息公共服务平台 http://std.samr.gov.cn/
57 国际标准组织官网 https://www.iso.org/home.html
(可搜索各类ISO标准,支持web网页查看,但下载PDF需要RMB)
58 arXiv - Cornell University(康奈尔大学)
arXiv is a free distribution service and an open-access archive for 2,219,424 scholarly articles in the fields of physics, mathematics, computer science, quantitative biology, quantitative finance, statistics, electrical engineering and systems science, and economics. Materials on this site are not peer-reviewed by arXiv.
三、搜索引擎高级搜索方法
0 * 通配符
Eg:搜索*擎
Result:搜索引擎、搜索某某某某擎
1 “” 双引号表示完全匹配,精确检索,结果中必须出现与搜索文本完全相同的内容。
2 逻辑词+(AND)、-(NOT)、|(OR)
Eg:A -B 搜索包含A但不包含B的结果(请注意A后面的空格不能省略)
Eg:(Internet OR Web)AND(search OR retrieval)
3 filetype 搜索对应类型的文件。例如:中国防火墙 filetype:ppt,即为搜索包含主题中国防火墙的ppt文件。(请注意使用英文的冒号)
补充:ppt、pptx、pdf、xls、doc、jpg、png .etc
4 site 在指定网站内搜索,比如:site:http://pan.baidu.com 特别好用,用来搜百度云里的资源。
1)搜索时屏蔽指定网站:flink -site:csdn.net
2)搜索时搜索指定网站:flink +site:csdn.net 或 flink site:csdn.net
5 ?S xxxx? yyy截词与屏蔽
无限截词。? S Program?
Result:Program、Programs、Programing等
有限截词。? S alloy??? ?
Result:alloy、alloyed、alloying等
屏蔽。? S Origni? Ation
Result:Orgnisation、Orgnization等
6 link 搜索网页中含有某链接的结果,比如搜索:link:http://baidu.com,则结果为包含百度这个链接的页面。
7 intitle 搜索标题内包含关键词的结果。
8 inurl 搜索网站地址中包含关键词的结果。
9 related 搜索相关网站。
10 index of 可以突破网站入口下载。
四、论文写作
1 写作基础知识
备注:关于论文的其它关键知识
{学术论文以议论为主};
{立论文与驳论文};
{论点/论据/论证};
{中心论点与分论点}
{论证方法:归纳法/例证法/演绎法/引证法/比较法/类比法/对比法/喻证法/因果论证/排除法}
{驳论途径:直接反驳;间接反驳(归谬/反证/.etc); }
{学位论文:学士{2万字左右;半年;15-20分钟答辩}/硕士{5万字左右;1年;40-60分钟}/博士{8万字+;3年}}
{《科学技术报告、学位论文和学术论文的编写格式》(GB7713-1987)}
{学位论文结构:目录/序言/导论/本论/结论/参考文献目录/后记/致谢/附录等}
{写作要求:文题/中英文摘要{中文:500-800字;关键词:3-10个}/前言(研究背景/研究目的/研究内容)/正文{材料与方法;结果;讨论;小结}/参考文献/文献综述{包括文体、正文和参考文献;学士:3000字+;硕士5000字+;博士:8000字+}/致谢/附录}
{特种文献:学位论文、期刊、会议论文、研究报告、专利、图书、行业标准}
1.1 选题
1.1.1 选题的含义和作用
解决”写什么”的问题。好的选题,等于写好了文章的一半。
1.1.2 选题原则
①创新性原则。新事物、新理论、新思想、新概念、新见解、新产品、新工程等。
②应用性原则。对社会、生产实践、人类、学术研究等方面的实用价值。
③可行性原则。作者是否可以完成(智力素质、其知识结构与基础、专业爱好、学术水平、研究能力、文字修养、写作时间、体质强弱等)。
1.2 主题
1.2.1 主题的含义与作用
中心思想。经作者观察、体验、分析、研究和对材料的处理与提炼。
主题是文章的核心与主体,是灵魂和生命。主题几乎决定了文章的质量。主题是否明确、正确、深刻,对社会与人民是否有利,决定了一篇文章的好与坏。
主题在文章内容中起统帅作用。文章取材、布局结构、表现方法、语言文字的使用等,都收到主题的制约,且它们必须服从、服务于主题。
客观性与主观性并存,以客观事实为依据。
1.2.2 主题的形成与提炼
①社会实践是形成主题的基础。
②认真研究全部材料
③深入发掘事物本质。
④正确的世界观、人生观的指导。
1.2.3 主题的基本要求
①正确
②集中。
③深刻。
④新颖。
1.2.4 主题与标题
标题从主出发,直接揭示主题思想。标题也能体现出不同文体的特点。
1.3 思路
1.3.1 思路的含义
1.3.2 思路与结构的关系
作者思路是文章结构的基础,而文章的结构又是作者思路的具体体现。如有的文章,文理不通,逻辑思维混乱,可能思想方法不对,归根结底是作者思路不清。
1.3.3 思路的基本要求
清晰。(顺序、层次、条理)
正确。
连贯。
周密。
1.3.4 思路的训练
①学会广思、深思和反思。
②阅读各类优秀作品。
③理清思路,撰写提纲。
1.4 结构
1.4.1 结构的含义及作用
谋篇布局。
1.4.2 文章结构的原则和要求
①准确反映客观事物发展的规律
②服从服务于表达主题的需要
③要适应于不同体裁的特点和要求
④结构要富于变化
=>严谨自然/组织细密/完整统一/顺理成章/匀称饱满/首尾圆合/形式和谐/通篇连贯
1.4.3 文章结构的具体内容
①层次。
②段落。
注意单一性、完整性、各段之间的联系、各段长短适中,不宜过长和过短。
③开头。开篇点题法、形象导入法等
④结尾。
⑤过渡。
⑥照应。
⑦详略得当。
1.5 语言
1.5.1 语言与写作的关系
1.5.2 运用语言的基本要求。
1. 用词准确
1.2 辨析词义
1.3 弄清每个词语的确切含义
1.4 注意词语的感情色彩
2. 造句通顺
2.1 句子结构完整
2.2 相关词语的搭配得当
2.3 词序合理
3. 语言生动
3.1 语言形象化
3.2 文辞优美
3.3 语言活泼
3.4 语言幽默
4. 文字简练
4.1 思维精密
4.2 删繁就简,节省用字。
4.3 阐述留有余地。不要把话说绝说尽。
4.4 要适当选用文言词语,显得干练。
4.5 朴素自然,即 无故意修饰,明白如话,通俗易懂。
1.6 起草
1.6.1 起草的重要性
打草稿、写初稿,是作者对文章的主题内容、结构和思路等无形思维的结果。。
1.6.2 起草程序(步骤)
①明确主题,拟制标题。
②确定体裁,选择结构。
③理清思路,列出提纲。
④认真动笔,从容成文。
1.6.3 起草技巧
①按提纲规定的范围动笔,不要随意改动
②在思维最活跃的时候动笔
③写不出来时不要硬写。
④要从容成文,不要“十步九回头”
1.7 修改
1.7.1 修改的重要性
初稿写成,只是半成品,还须修改,提高文章质量在此一举。
1.7.2 修改的范围和程序
①主题的校正。
②观点的修订。
③结构的调整。
④材料的增删。
⑤语言的修饰。
篇幅修改、文字推敲锤炼、图标符号的修改
⑥标点符号的修正。
1.7.3 修改的方法
热改法/冷改法/求助法/读改法
四 参考文献
1.《信息检索与利用》.上海交通大学出版社
2.《信息检索与利用 | 2版》.科学出版社.张俊慧(主编)
3. [信息检索与利用(江南大学/中国大学MOOC)](https://www.icourse163.org/course/JIANGNAN-1207113825?tid=1467143539)
4.[如何高效地使用搜索引擎?](https://www.zhihu.com/question/28013848)
5.[如何正确高效地使用学术搜索引擎? - 科研](https://www.zhihu.com/question/35510957)
6.[中图分类法查询1](http://www.ztflh.com/?c=17417)
7.[中图分类法查询2](http://ztflh.xhma.com)
8.[国家标准GB7713-87(科学论文编写格式)](https://wenku.baidu.com/view/981cd2e0941ea76e58fa04f8.html)
9.[引用论文格式生成器](http://cite.readpaul.com)
10.[SCI - Web of Science](http://apps.webofknowledge.com)
11.[亚马逊 - 新书检索](https://www.amazon.com)
12.[OCLC的WorldCat(全世界图书目录检索)](https://www.oclc.org/en/worldcat.html)
13.[如何收集和整理论文(面向CS专业)](https://ying-zhang.github.io/misc/2016/we-love-paper/)
14.[中国学术期刊论文投稿平台](http://www.cb.cnki.net/journal/Search.aspx?navi=I)
15.[远见搜索-中国知网](http://yuanjian.cnki.com.cn)
16.[sciencemag](http://www.sciencemag.org)
17.[sciencedirect](https://www.sciencedirect.com/)
18.[最新SCI影响因子查询及期刊投稿分析系统](http://www.letpub.com.cn/index.php?page=journalapp&view=search)
19.[arXiv - cornell university](https://arxiv.org/)
本文链接: https://www.cnblogs.com/johnnyzen
关于博文:评论和私信会在第一时间回复,或直接私信我。
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!
日常交流:大数据与软件开发-QQ交流群: 774386015 【入群二维码】参见左下角。您的支持、鼓励是博主技术写作的重要动力!