使用Academic Search进行学习领域的选择——记黄同学使用Academic Search 的心得
编者按:
最近我的哥们黄同学需要进行CS专业领域的选择,面对CS领域下形形色色的Subdomain,该选择什么方向为好?在某日跟我提到此事后,我便推荐他使用微软学术搜索。以下是黄同学使用微软学术搜索完成专业领域选择的过程记录。
用户背景:
黄同学,我航高工大三本科生,计算机科学与技术专业。
使用Academic Search的目的:发掘CS下的热门领域,进行专业选择
感兴趣方向:Social Network,Machine Translation,Peer to Peer,Information Retrieval
用户使用过程:
1. 学习阶段与功能选择
由于黄同学之前没有使用过Academic Search,笔者首先向其大致介绍了AS的主要功能,并建议他通过两个途径进行热门领域的比较:
1 查看相应Keywords(见上)的论文发表与引用数目图
2 使用AS的Domain Trend功能,横向比较CS下各个subdomain的论文发表情况。
黄同学希望通过衡量某个领域的热度(主要还是看论文发表数目),并结合自我的个人兴趣,来确定今后的研究方向。因此,以上两种手段是比较有效的。
2. 具体使用阶段
2.1 Domain Trend功能
在大致熟悉了AS的主要功能后,黄同学便开始了具体工作J,首先使用Domain Trend, 但打开Domain Trend的主界面后,小黄在左侧的subdomain中找了又找,只找到了Information Retrieval……
“咋没有其他的关键词呢?!”
我向他解释:AS中的Domain Trend只列出了AS中定义的subdomain的论文数目信息,其他的关键词不在subdomain范围之内。它们可能属于某个subdomain。
那么,该如何找到上述关键词所在的subdomain呢,我跟小黄犯了愁,Social Network属于啥?Network & communication还是World Wide Web?Academic Search貌似没有给出Domain与Keywords的对应关系哎…..
2.2 直接搜索Keywords得到相应图表
比起第一种方法,这招来的更实在~
但是,我们在检索各个关键词结果后发现,对于上述所有KeyWords,2011年与2012年的论文publication数目都少于2010年,导致我们无法根据图表判断上述领域在11年与12年是否热门(见下图)。
其中,12年的数据只有两位数,但为什么11年的也相对较少?估计是AS对近两年的数据收录不全。
但让小黄没有想到的是,keywords页面还给出了领域大牛们对keyword的定义,方便了用户对领域进行初步的认识与了解。
经过一番搜索之后,小黄认为Academic Search提供的近两年的论文发表数目不太准确,不能很好的反映某一领域的发展趋势,只能够通过横向比较各个领域间的论文发表数目来判断热门领域。最后,小黄选定了Machine Translation(兴趣是第一位的J)。
最后,根据小黄同学的反馈,我们一起总结了AS的各个方面的优缺点~
项目 |
优点 |
缺点 |
数据量 |
横向来看,CS各个subdomain的论文收录颇全,足够支撑日常论文检索需求 |
对近两年,特别是2012年的论文收入很少 |
界面 |
界面设计很人性化,特别是各项Visualization功能,将数据可视化,特别有利于向黄同学这类需要进行领域分析与研究的用户 |
“怎么没有中文界面?!”(用户语),Google学术至少还有个中文版,PS:本人常用国产万方(wangfangdata.com.cn) |
功能 |
对比Google学术搜索与国内的万方(wanfangdata.com)、中国知网等,微软学术搜索的功能明显更多,而且数据的可视化程度更高 |
部分功能在细节上仍需要完善,比如Domain Trend无法添加Custom Domain(比如比较用户指定个N个关键词) |
准确度 |
对大部分KeyWords的搜索比较精准 |
搜索结果排名上存在一些问题 对于部分keyword,如social network,题名social and biological networks的文章竟然排在第一页第三位,远高于题名包含social network的文章 搜索information retrieval,无法自动进入关键词页面(虽然关键词同用户键入文本一致) |
用户对产品的改进意见:
- 强烈要求有类似于Domain Trend的Keywords Trend功能,用于横向比较不同的Keywords
- 一个可能的功能性bug:键入某个keywords,无法自动导航至关键词页面,如information retrieval,而键入social network则可以,虽然用户的query string同关键词是完全match的。希望能够修复这个bug(我发现当keyword与某个期刊或会议的关键词重叠后,系统会自动给出提示,让用户选择进入哪个页面,那么为何keyword不会与其发生重叠时自动进入keyword页面,而不是让用户选择是否由结果页面跳转到keyword页面?应该统计当用户搜索某个keyword时的意向页面来决定哪个优先展示)