Team Project 设想 -- 基于用户信息的学术搜索

  在这个信息爆炸,而我们还缺乏信息的时代,搜索引擎几乎成了我们日常生活不能或缺的一部分,但是其返回的结果往往不能尽如人意,无法区分相似但不相关信息及无法有针对性的理解用户需求是现阶段搜索引擎的两个大问题。而作为搜索软件的一个特例,学术搜索的结果在这两个方面似乎也没什么长进,甚至更差。比如搜作者,有很多重名的人无法区分,导致一个计算机的研究者名下会有生物的、地理的文章,何其怪哉;搜某一种方法,而这种方法可能在有很多研究方向都会使用,这种情况下用户想要信息会被混在很多的不想要的信息之中,难以挑选。当然这些都是搜索引擎领域很难解决的问题,但是学术搜索相比普通搜索有其特别之处。由于学术的专业性,学术搜索的使用者大多只会搜索与他自己研究方向相关的内容,而这些内容的范围往往很小。比如,研究计算机视觉的使用者,搜索的内容绝大多数都是计算机视觉领域的相关问题,这就为我们解决以上两个问题提供了一个很好的前提条件。

 

  基于这个特性,我们可以根据用户信息来优化搜索结果。

 

下面基于NABC模型, 来分析我们的想法:

1) N (Need 需求)

  学术搜索用户对于搜索精度,和搜索引擎对用于用户键入关键字理解能力的高要求 

2) A (Approach 做法)

  最基本容易实现的做法:在用户机器上实现搜索引擎的客户端,或者侧边栏应用等,记录下用户的搜索信息,比如研究方向、方法等,然后进行相关分析,进而对以后用户搜索的关键字、返回结果等进行适当处理以达到精确搜索的结果。

如果有条件的话,可以在搜索引擎上设置用户账号,在搜索引擎内部处理。

3)B (Benefit  好处)

   提高了搜索的精度,和对用户的理解能力。例如上面所说的重名的问题,通过对用户研究方向的限定可以排除绝大多数不同领域方向的重名 

4) C (Competitors 竞争)

   各学术搜索引擎可能有类似小功能,但是似乎没有着重做这方面的内容,所以还是有可以开发的空间


由以上分析我们可以得出一个初步的结论,基于用户信息的学术搜索在可行性及前景方面都有可作为之处。


by Shaoqing

posted @ 2010-12-03 18:53  ustc_msra_ase  阅读(1328)  评论(11编辑  收藏  举报