摘要:
12月28日,依然在Compass,依然是济济一堂,2010年的最后一场计算机前沿讲座由李航老师开讲。 没有炫目的效果展示,没有激昂的动情解说,有的是对经典算法的娓娓讲述,有的是同学们的凝视静听。 李老师此次讲座的题目是机器学习及其在信息检索领域的应用。短短2个小时的讲座,老师准备的课件竟有97页之多,老师的认真负责可见一斑。李老师从大家都熟悉的数码相机中的人脸检测功能开始引入整个的讲座。从机器学习的基本概念到其重要性再到机器学习的经典算法和在网络检索中的应用,李老师都进行了透彻的讲解。从老师的讲解中我了解到机器学习是一种以预测和分析为目的,以计算机和网络为平台,受数据驱动的方法,在诸如自然语 阅读全文
摘要:
傅孝明:今天:和文凭,凯,蒋老师谈论了借口问题。然后和文凭一起pair work了一会。明天:数据库的问题和接口的定义等的问题。蒋老师:今天:与PM商定数据库的配置工作暂缓,与界面组商定了新的方案,读了学术搜索中模型层相关代码,学习了Json相关技术,重新考虑的模型层的实现方案。work item:37601。 明天:开始核心的代码编写work item:37601。障碍:细节性的结果取出与产生Json数据结构还需近一步研究胡文凭:今天:Items 37352:完成了初步 layout算法的编码工作明天:Item 37353:准备部分testing数据,对layout算法进行调试和测试陈凯:今 阅读全文
摘要:
傅孝明:今天的工作:联系IT准备解决数据库的问题。明天:争取把接口的问题解决,和蒋老师讨论数据库的问题。争取能看到一个很简单的版本。陈凯:今天的工作:为展现Author的UI添加了Edit和Expand按钮,点击Edit访问Academic Search的Edit页面,基本明确了为展示族谱要修改的函数。 item37361.明天的工作:与蒋老师商定传输数据的格式,继续为UI添加鼠标响应事件,弄清楚GuanxiMap中几个类的作用。item37362.主要的障碍:对于Author展现的实现细节还有些不清楚。胡文凭:今天:Work: items:37348 :理清了academic search 阅读全文
摘要:
傅孝明:和佳磊和少卿讨论了数据获取的具体要求等。和凯,文凭讨论接口的问题。明天:继续讨论接口,但是是微软学术co-author算法基础下。障碍:接口在微软学术co-author算法基础下很麻烦。任少卿:今天完成37607, 编写Supervised师承信息辅助收集系统的底层及部分界面,将收集到信息导入数据库明天进行37608, 完善Supervised师承信息辅助收集系统的界面遇到的困难:由于Academic Search API暂时还没有帮助文档,不清楚某些特殊的查找如何设置陈凯:今天的工作:完善了界面,在Yan Xia师兄帮助下和VisualizedSearchAcademic原有的CoA 阅读全文
摘要:
傅孝明 :和肖巍确定了testcase,和蒋老师确定了user story,dailymeeting。明天:完善test case,把握整体的进度和跟进爬虫的问题。(我没有建item)陈凯:今天的工作:基本完成了展示界面的构建工作。工作项:37359。基本界面:。明天的工作:完善展示界面,展现简单的添加了我们定义的三个按钮(编辑、展开、主页)的关系图。工作项:37360.任少卿:完成37605.37606, 设计数据库表及表项,建立数据库,编写数据库调用接口,编写自定义格式文本输入数据库的输入程序,将现有信息输入数据库。明天37607,明天开始编写一个supervised 的师生关系爬取程序。 阅读全文
摘要:
傅孝明:今天明确了每个模块的接口和重新分析爬虫的实现,进行了daily meeting。然后进行了测试计划的重新设计和优化。明天:确定测试计划。争取在爬虫算法上面达成一致。陈凯:今天确定了整个familytree 的展示界面,和牛特同学说的基本一致,类的设计方面决定重载YanXia同学给的一些类,添加我们需要的效果。完成的work item ID :37358。明天的工作:实现展现界面 ,重载VsisualizedSearchAcademic中的Author Item类以满足我们的展示要求。胡文凭:今天确定了族谱layout的树形展现形式,向佳磊同学讨论了一个学术家族的基本规模,提取了微软学术 阅读全文
摘要:
由于我们的项目有巨大的的数据依赖性,第一阶段我们计划在一个相对有限的数据库的基础上保证各种预期功能的正确实现,所以第一阶段的测试以功能测试为主,至于学术族谱数据库本身的扩大,我们可以设计一些用户的编辑界面,让大量用户进行添加和修改,使族谱信息越来越完善。下面是第一阶段测试计划(从12月27日开始至1月17日):1. 12.27~12.30 spec测试:在项目开始的前5天,软件肯定是没有准备好的,所以测试人员只能根据spec进行一些测试用例的设计,对spec进行反复论证和修改;2. 12.27~12.31 单元测试:从第4天开始,按照计划开发人员应该会完成一些小的功能模块,期间开发人员自己会做 阅读全文
摘要:
在上一篇博客里,我们列出来了一些典型用户和典型场景,现在选取典型场景说明如何将软件功能结合起来实现这些场景。场景1:王鸿 作为某领域大牛,为了了解学生们以及学生的学生们的发展现状,王鸿进入学术族谱页面,搜索自己的名字“王鸿”以及一些附加的信息定位到自己,界面上就会出现以自己为核心的一颗族谱关系图,看到自己的学生以及学生的学生关系连线,然后就能点击某个学生,就可以进入其在学术搜索上的主页,进而了解学生的近期研究情况等信息;当需要了解本领域内最新发展情况时,可以根据年份信息,通过学术族谱的家族评分功能,了解最近自己家族的发展情况和领域内活跃的家族以及新出现的家族。场景2:张国栋 参与项目评审,想要 阅读全文
摘要:
在微软学术搜索上开发学术族谱,通过搜索技术在互联网上爬取大量的学者之间师承关系的信息,将其清洗、归纳、梳理成师承关系网络,并用富客户端技术直观、清晰、动态地向用户展现具有丰富语义的学者师承关系,并支持一定授权与验证基础上人工修正,为学者科学研究、论文写作、课题申请、扩展学术交往、增进学术友情、密切师生关系提供全面细致的支持。下面是典型的persona:名字:王鸿性别,年龄男,64职业教授、院士生活/工作情况数学领域的资深权威专家,桃李满天下,久负盛名动机,目的,困难功成名就,有时想知道我的学生们正做什么,巡视一下我的学生,但年纪大了,眼花.用户比例典型场景名字:张国栋性别,年龄男,43职业教授 阅读全文
摘要:
高德纳的丛书名叫《计算机编程艺术(The Art of Computer Programming)》-- 而不是《计算机编程科学( The Science of Computer Programming)》。 他在1984年获得图灵奖时发表感言说,“计算机编程是门艺术”。程序作为人们思想的结晶,我们不仅要求它可以工作,可以产生正确的结果。我们同时要求它的结构清晰,语法高效,结果美观,能体现出创作者卓越的思想。这一切跟艺术家创作艺术品何其相似。您也许认为这样比喻不恰当,您无法从程序中看到任何美感。这可能是因为大部分人还是看不懂程序,但即使这样,一些伟大的程序还是能让您看到它与众不同的美,高德纳的 阅读全文