R语言如何实现文献计量——bibliometrix包的使用
本文参考了R语言统计与绘图和走天涯徐小洋地理数据科学公众号的文章,膜拜大神!推荐大家关注!(两位老师请后台结一下广告费( • ̀ω•́ )✧)另外R语言统计与绘图公众号的文章来源于生态R学社 ,作者生态R学社。也推荐大家关注(▽)/★☆
上周组会的时候,老板提到让大家学习一下文献计量的方法,推荐了CiteSpace这个软件,我之前有试着用过这个软件,确实挺好用的,就是用起来不太顺手 ̄へ ̄。
我想起之前在R语言统计与绘图公众号上看到了引自生态R学社的bibliometrix,快速实现文献计量分析的酷炫R包这篇文章,就想试一下,正好假期整理之前在微信浮窗的好文章(PS.有木有人和我一样,在微信更新浮窗无数量限制后,里面堆满了无数的文章),发现了徐老师的R语言文献计量分析初探还有文献计量从0到SCI(二)使用biblioshiny入手WOS文献计量,如获至宝,仔细阅读两篇文章之后,决定自己也记录一下这么酷炫的R包ヾ(゚∀゚ゞ)
bibliometrix包官网:https://www.bibliometrix.org/index.html
2023.9.17
没想到我最火的是这一篇博客,阅读量有20多万,反而WRF、CMAQ安装没啥人看,哈哈哈,果然学大气模型的人真是少。可是我后来不用R语言了,大家在评论区问的问题我也不会哎,所以大部分都没有回答,在这里和大家道歉。最近发现bibliometrix更新了,界面发生了一些变化,大家自行尝试吧
1 准备
1.1 安装bibliometrix
包:
install.packages('bibliometrix', dependencies=TRUE)
借助R的shiny工具,叫做BiblioShiny,它的底层其实就是Bibliometrix包
通过以下方式调用这个shiny程序:
library(bibliometrix) biblioshiny()
第一次启动Shiny程序,可能会由于缺少某些支持的包而报错,可以手动安装一下对应缺失的包。
如上图就是缺少‘httpuv’这个名字的程辑包,安装就行:
install.packages("httpuv")
如此缺啥补啥,直到可以运行为止(=゚ω゚)ノ
成功后会自动调用你的默认浏览器,出现如下工作界面:
1.2 文献数据准备
bibliometrix包官网给出了支持的文献搜索引擎和引文格式:
Source | URL | Format | Extension |
---|---|---|---|
Web of Science | https://www.webofknowledge.com/ | ‘BibTeX’ ‘plaintext’ ’EndNote Desktop | ‘.bib’‘.txt’‘.ciw’ |
Scopus | https://www.scopus.com/ | ‘BibTeX’ ‘CSV export’ | ‘.bib’ ‘.txt’ |
Dimensions | https://app.dimensions.ai/ | ‘Bibliometric mapping’ ‘Excel’ | ‘.csv’ ‘.xlsx’ |
The Lens | https://lens.org/ | ‘CSV export file’ | ‘.csv’ |
PubMed | https://pubmed.ncbi.nlm.nih.gov/ | ‘PubMed export file’ | ‘.txt’ |
Cochrane Library | https://www.cochranelibrary.com/ | ‘plaintext’ | ‘.txt’ |
以Web of Science为例,我搜索的是我目前在做的Atmospheric carrying capacity,注意:这里记得数据库选择核心合集,不然后面导出时会有问题
然后导出为其他文件格式,这里记录内容要选择全纪录与引用的参考文献,支持的BibTeX、
plaintext和EndNote Desktop格式都可以选,我这里选择纯文本。
一次只能导出500条,我有774条记录,导出了两次,然后把这两个txt文件压缩为**.zip**格式( ̄︶ ̄)
2 导入数据
在刚打开的浏览器中,选择Data→Import or load files,导入数据:
导入成功如下ヾ(=・ω・=)o:
3 开始分析
3.1 数据情况
3.1.1 年发文量
Dataset→Annual Scientific Production
统计年发文量
3.1.2 平均每年引用量
Dataset→Average Citations per Year
3.1.3 三个字段之间关系的桑基图
Dataset→Three-Fields Plots
看三个字段之间关系桑基图
3.2 文章来源分析
3.2.1 主要相关文章来源
Sources→Most Relevant Sources→Apply
3.2.2 来源聚类分析
Sources→Source clustering through Bradford’s Law
3.2.3 来源影响因子
Sources→Source Impact
支持H指数、G指数、M指数和总被引量
3.2.4 来源活跃度
Sources→Sources Dynamics
3.3 作者分析
3.3.1 最相关作者
Authors→Most Relevant Authors
3.3.2 作者不同时间发文情况
Authors→Authors’ Production over Time
通过这个可以显示不同作者发文情况,发文最多的前20名作者发文时间段和发文量,统计发文量前多少名的作者可以自由设置。
3.3.3 相应的作者的国家
Authors→Corresponding Author’s Country
3.3.4 发文机构比较
Authors→Most Relevant Affiliations
3.3.5 发文量国家比较
Authors→Country Scientific Production
3.3.6 被引量国家比较
Authors→Most Cited Countries
3.4文章分析
3.4.1 最高被引文章
Documents→Most Global Cited Documents
3.4.2 Reference Spectroscopy
Documents→Reference Spectroscopy
3.4.3 词云分析
Documents→WordCloud
3.4.4 Word Dynamics
Documents→Word Dynamics
3.4.5 Trend Topics
Documents→Trend Topics
3.5 Coupling Map
3.6 热点和共现网络
3.6.1 共现网络
3.6.2 Thematic Map
3.6.3 Thematic Evolution
3.6.4 因子分析
3.7 时序图
3.8 Collaboration WorldMap
就是这样啦,我都试着弄了弄,挺好玩的(*・ω-q),bibliometrix
包真是够酷炫。
大家还有什么好玩的用法,可以评论呀ヾ(=・ω・=)o
下次见( ̄︶ ̄)
本文作者:陆詟水栗
本文链接:https://www.cnblogs.com/AllenG/p/18078640
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步