关于微软学术搜索
(由于没让说优点,所以下面的内容只有对缺点的描述,说的有点狠。。)
第一部分:微软学术搜索网站的功能性问题
根据老师在博客上的要求,我在阅读了相关的微软学术搜索项目的相关功能之后,亲自测试了大多数的搜索功能(其实在之前做团队项目Ui的时候就已经接触过了,不过当时主要集中在界面元素的设计方面,而这次测试的重点在于其搜索功能),其中包括:
(1) 简单搜索(仅搜索关键词)
(2) 学科方面专业搜索(使用All Domains的面板来选择要搜索关键词的学科范围,不过要实现这个目的可以先使用简单搜索,然后在搜索结果页面的左边也可以再次选取想要的学科方面,而且此时还可以看到关键词在每个领域的结果数量)
(3) 高级搜索功能(Advanced Search功能,我们在设计XueBa网站的时候采用的也是这样的功能设计方案,即根据搜索内容的类型提供给用户相应的具体信息的限制)
(4) 测试了微软学术搜索中的信息可以由使用者自己修改的功能(首先要登录LiveID)
(5) 征稿信息查询的功能,个人感觉这个做的很不错!
(6) 作者或者学科家族关系图(这个功能还是很有用的,毕竟图形化的信息能够更好更快地被人接受,但是我在测试Embed功能,也就是把图片嵌入自己在其它网站的博客页面里的时候出现了一点小问题,不知道能不能算是functional bug,在后面细讲)
(7) 查看内容的引用信息(这个其实重要的还是给人一个大致上的概念而已,因为当搜索比较的内容很多的时候,图就会显得不是很细致,这样分析数据肯定是不行的,而引用信息的查看其实也用不到数据,仅仅是趋势上的认识就可以了)
(8) 学术地图与机构比较(不得不说这个表现手法确实很高端,我搜了很多国内外的研究机构,给出来的信息还是相当全面的)
有关关系图Embed的问题:经自己的不完整测试,嵌入的内容在cnblogs的博文里是可以成功浏览的,但是在其它有些网站的博文会出现头像显示不出来或者链接失败的那种小叉的情况,例如网易和百度的(后来发现好像当把论文列表嵌入的时候也有同样的问题,而且列表要用javascript嵌入,不知道是因为有些网站自己的问题还是生成的javascipt有问题呢?但是cnblogs里都没有问题,个人感觉这个貌似不能算是个functional bug吧)
还有一个应该算是功能上的问题,这个问题同样出现在了我们在做XueBa的时候,考虑到使用者最方便地使用搜索功能,所以在网站的任何地方都应该设置搜索功能的使用元素,而学术搜索在很多很内层的页面里也是没有这个的,这就也许会造成当用户在搜索的过程中想改变搜索内容时不得不退回到刚才的搜索结果页面(最多是这个页面吧)才能继续,这样至少在我使用起来是很不方便的,而且要改进这个问题应该非常容易吧(我在改XueBa界面的时候就很容易~)
第二部分:
我之前找论文很多都是使用谷歌的学术搜索(http://scholar.google.com)。近几天,通过使用微软学术搜索,我发现了很多它们之间的不同。在通过阅读微软学术搜索的10个版本迭代(http://www.cnblogs.com/xinz/archive/2012/02/20/2358888.html)后,我似乎找到了一些原因。
首先,该文章并没有花很大的篇幅介绍其需求分析阶段,而我觉得这正是微软学术搜索最缺少的。
在V2的开始阶段,博客中展现了微软学术搜索需要考虑的三类典型用户。而最终得出的结论是——不比拼论文下载,没了。
这最终决定了我在它和谷歌学术搜索的比拼中,选择了后者。
这三类典型用户其实最需要的是啥?以下是我的猜测:
Mary:他其实已经对他所在了领域十分了解。他需要做的是把握他所在的领域的最新进展,这需要搜索引擎的更新速度非常快,范围非常广。另外,比较各个学校/机构的科研产出和动向也比较重要,但这似乎不应该是学术搜索引擎的主业。
John:他其实结合了Mary和小勇的部分特点。
小勇:正如我或者我的学长们一样。他们首先需要的是找到自己的领域,并做深入的调研。这需要搜索引擎可以更好的——找到最符合搜索关键词的论文(排序要好),然后论文要多(这样才会深入);然后,他们需要学习相关论文的要点,这需要搜索引擎——具备下载功能:下载不是一个需要比拼的功能,而是一个必需的功能。
综上所述,一个好的学术搜索引擎最需要什么?大量的数据、优质的排序、符合用户需要的统计、下载。其中最重要的是什么?大量的数据。
而这些,微软学术搜索只占了一点——统计,各种统计表,也就是博客里面说到的“联系”,确实能够对学校、作者、领域有一个全方位的认识。但是,有了认识,我希望深入了解的时候,我还是会选择谷歌。
所以说,微软学术搜索的十个阶段,出问题的恰恰在一开始的需求分析,于是它在错误的道路上越走越远。。。
比如说,我以我上个暑假一直在搞的一个关于VLC(Visual Light Communication)的研究为例。
我首先发现了一篇描述Cobra的文章,它和我的研究领域非常相似。于是我分别在微软学术搜索和谷歌学术搜索上搜索“Cobra”。唰,结果出来了:
显然,叫Cobra的太多了。但是显然,谷歌的结果比微软的多。Cobra和VLC有关,于是我把关键词加上了VLC:
我还希望试一试微软学术搜索边栏上的分类功能呢,这下没必要了。。这也太少了吧,只有一条搜索结果。而谷歌不仅告诉我了那篇文章,还告诉我了那篇文章的Demo,还告诉我了引用了那篇文章的文章。。还告诉我了下载地址。
算了不追究这个了,通过通读Cobra,我发现Cobra一篇似乎不够,我需要的是它引用的和引用它的所有文章(尤其是后者)。可惜的是,微软学术似乎都不支持查看一篇论文的引用,除非进入其他的网站或者将它下载下来(微软学术搜索似乎有引用链的功能?为什么我找不到?),而谷歌可以通过“相关文章”找到它们。另外,我希望看到引用它的所有文章。可惜的是,微软也不提供这个功能(或者提供了,我没找到?),而谷歌在明显的位置告诉我“被引用次数:1”。
我通过谷歌获得了那篇引用了Cobra的文章,它的名字叫做“Smooth Transmission over Unsychronized VLC Links”,这是一篇比较新的paper。我通过微软搜索这篇文章,结果是:
没有。
这意味着什么?意味着假如我不幸想到的是和那篇文章一样的内容,我很高兴(没有人发现这个问题!我可以发表论文了哦也),于是辛苦写出了一篇文章投了出去,可是百投百败,却不知道为啥(我写的没问题呀)。终于等到白了少年头用了回谷歌,才终于发现——原来是微软毁了我的一生。。
好了,有点跑题。说回来,没有大量的数据,搜索的可靠性就会降低。当然,也可能与我搜索的论文都比较新有关。但是,微软学术搜索在一开始的需求分析时就没有将内容和质量放在第一位,却把重心投入到了花拳绣腿的联系上,直接导致了它先天功能不全,难以与谷歌搜索抗衡。而那些花拳绣腿,在没有大量的数据支撑的时候,准确性也值得商榷。我认为,应该加强微软学术搜索的数据库,至少加到和谷歌学术搜索在一个数量级。
另外允许我吐一下嘈,微软近些年一直在犯类似的问题——一直没有将需求分析放在第一位,不去考虑用户到底真正需要什么,却总在费尽心思的找差异性。比如WP7、WP8(至今没有控制重力感应的功能,至今没有草稿箱功能,至今没有音量分开控制功能)、Win8(RT与Windows合在一起不知道是谁想到的馊主意),希望邹老师能够向上级反映。
第三部分:
采访对象:同届计算机学院同学 岳喜春
相片如下:
用户的问题解决了么?不全是
软件的优点:
界面美观,直观,大方,图例清晰。
软件的缺点:
英文版看不懂,搜索不到中文论文,没有引用信息。
改进意见:改掉上述缺点。
第四部分:搜索网站在移动设备上的应用
(1) 目前市场上有什么样的产品了?基于各大网络搜索引擎,很多搜索网站都多多少少地做了一些自己产品在移动设备上的应用,介于个人使用的移动设备的关系,在此仅以iOS系统的移动设备应用举例吧,例如百度,谷歌(虽然谷歌学术还没有独立的搜索应用)等都有自己的移动应用,而且现在看比较火的Win8平板应用更是数不胜数;
(2) 设计什么样的功能?为什么会使用你的应用?由于是搜索功能的应用,功能自然是基于搜索的,然后其它的辅助功能例如:图形搜索,可以分析曲线图和饼状图之类的功能,还有基于多个领域的搜索,收集词条和搜索结果(搜索历史),关注的动态信息,这样用户不仅可以用这个应用来实时搜索,还可以记录下来曾经搜索内容的离线信息,方便以后查看和提醒等等;
(3) 如果你的团队有五个人,三个月的时间,你作为项目经理,应该如何配置角色?例如开发,测试,美工等等?首先介于我在团队项目里的任务就是完成美工,个人觉得美工还是有特定的一个人来完成比较好,风格统一,然后最后的测试程序要分不同的部分由不同的负责人测试各自的部分,最后在汇总测试,所以测试部分不需要非常明确的某个人来完成,在开发方面,需要一个人负责数据库部分,其它的可以根据软件内部不同部分来具体分工;