关于“微软学术搜索项目历程”的疑问(李芳 作业二)

微软学术搜索项目历程介绍:http://www.cnblogs.com/xinz/archive/2012/02/20/2358888.html

    在文中提到V2阶段时,我觉得很重要的一点就是“核心价值是什么,决定不做什么?”。

 

    这一点,我觉得非常重要,当时WAWH(www.wawh.com)的CEO来我们学院做讲座的时候,就说过 他们当时也在平衡核心价值和功能的多样性。如何在核心的产品和丰富的产品之间做平衡,既然产品具有个性,又能保证产品的多样性。

 

    看来每一个平台都有着这样的困扰。我想MS做了一个非常好的抉择,就是不比“论文下载”这一服务。否则,我想考虑到平台下载的合法性和利益分配问题的话,或许还不如山寨版本的搜索下载平台

?疑问:老师,做调研的时候,典型用户的资料是否都是真实资料吗?包括姓名?

 

 

clip_image002

?疑问: 老师,precision/recall 数据是什么数据, F-Score相当低说明什么?F-score怎么算的?

?疑问: 老师,这个项目处理这么大的数据量,它是用什么技术处理的,是用hadoop技术来处理的吗?

clip_image004

?疑问: 老师,上图中,说“出现一个“Zhang Lei”写了几千篇论文的滑稽情况”,为什么会出现这种情况,同时,又是怎么姓名消歧的?

 

clip_image006

?疑问: 老师,按照上面说的,那这个项目队未来有什么样的计划,或者向哪方面发展?

posted @ 2012-03-12 23:19  Only For SS  阅读(216)  评论(4编辑  收藏  举报