12 2010 档案
摘要:傅孝明:今天:和文凭,凯,蒋老师谈论了借口问题。然后和文凭一起pair work了一会。明天:数据库的问题和接口的定义等的问题。蒋老师:今天:与PM商定数据库的配置工作暂缓,与界面组商定了新的方案,读了学术搜索中模型层相关代码,学习了Json相关技术,重新考虑的模型层的实现方案。work item:37601。 明天:开始核心的代码编写work item:37601。障碍:细节性的结果取出与产生Json数据结构还需近一步研究胡文凭:今天:Items 37352:完成了初步 layout算法的编码工作明天:Item 37353:准备部分testing数据,对layout算法进行调试和测试陈凯:今
阅读全文
摘要:傅孝明:今天的工作:联系IT准备解决数据库的问题。明天:争取把接口的问题解决,和蒋老师讨论数据库的问题。争取能看到一个很简单的版本。陈凯:今天的工作:为展现Author的UI添加了Edit和Expand按钮,点击Edit访问Academic Search的Edit页面,基本明确了为展示族谱要修改的函数。 item37361.明天的工作:与蒋老师商定传输数据的格式,继续为UI添加鼠标响应事件,弄清楚GuanxiMap中几个类的作用。item37362.主要的障碍:对于Author展现的实现细节还有些不清楚。胡文凭:今天:Work: items:37348 :理清了academic search
阅读全文
摘要:傅孝明:和佳磊和少卿讨论了数据获取的具体要求等。和凯,文凭讨论接口的问题。明天:继续讨论接口,但是是微软学术co-author算法基础下。障碍:接口在微软学术co-author算法基础下很麻烦。任少卿:今天完成37607, 编写Supervised师承信息辅助收集系统的底层及部分界面,将收集到信息导入数据库明天进行37608, 完善Supervised师承信息辅助收集系统的界面遇到的困难:由于Academic Search API暂时还没有帮助文档,不清楚某些特殊的查找如何设置陈凯:今天的工作:完善了界面,在Yan Xia师兄帮助下和VisualizedSearchAcademic原有的CoA
阅读全文
摘要:傅孝明 :和肖巍确定了testcase,和蒋老师确定了user story,dailymeeting。明天:完善test case,把握整体的进度和跟进爬虫的问题。(我没有建item)陈凯:今天的工作:基本完成了展示界面的构建工作。工作项:37359。基本界面:。明天的工作:完善展示界面,展现简单的添加了我们定义的三个按钮(编辑、展开、主页)的关系图。工作项:37360.任少卿:完成37605.37606, 设计数据库表及表项,建立数据库,编写数据库调用接口,编写自定义格式文本输入数据库的输入程序,将现有信息输入数据库。明天37607,明天开始编写一个supervised 的师生关系爬取程序。
阅读全文
摘要:傅孝明:今天明确了每个模块的接口和重新分析爬虫的实现,进行了daily meeting。然后进行了测试计划的重新设计和优化。明天:确定测试计划。争取在爬虫算法上面达成一致。陈凯:今天确定了整个familytree 的展示界面,和牛特同学说的基本一致,类的设计方面决定重载YanXia同学给的一些类,添加我们需要的效果。完成的work item ID :37358。明天的工作:实现展现界面 ,重载VsisualizedSearchAcademic中的Author Item类以满足我们的展示要求。胡文凭:今天确定了族谱layout的树形展现形式,向佳磊同学讨论了一个学术家族的基本规模,提取了微软学术
阅读全文
摘要:由于我们的项目有巨大的的数据依赖性,第一阶段我们计划在一个相对有限的数据库的基础上保证各种预期功能的正确实现,所以第一阶段的测试以功能测试为主,至于学术族谱数据库本身的扩大,我们可以设计一些用户的编辑界面,让大量用户进行添加和修改,使族谱信息越来越完善。下面是第一阶段测试计划(从12月27日开始至1月17日):1. 12.27~12.30 spec测试:在项目开始的前5天,软件肯定是没有准备好的,所以测试人员只能根据spec进行一些测试用例的设计,对spec进行反复论证和修改;2. 12.27~12.31 单元测试:从第4天开始,按照计划开发人员应该会完成一些小的功能模块,期间开发人员自己会做
阅读全文
摘要:在上一篇博客里,我们列出来了一些典型用户和典型场景,现在选取典型场景说明如何将软件功能结合起来实现这些场景。场景1:王鸿 作为某领域大牛,为了了解学生们以及学生的学生们的发展现状,王鸿进入学术族谱页面,搜索自己的名字“王鸿”以及一些附加的信息定位到自己,界面上就会出现以自己为核心的一颗族谱关系图,看到自己的学生以及学生的学生关系连线,然后就能点击某个学生,就可以进入其在学术搜索上的主页,进而了解学生的近期研究情况等信息;当需要了解本领域内最新发展情况时,可以根据年份信息,通过学术族谱的家族评分功能,了解最近自己家族的发展情况和领域内活跃的家族以及新出现的家族。场景2:张国栋 参与项目评审,想要
阅读全文
摘要:在微软学术搜索上开发学术族谱,通过搜索技术在互联网上爬取大量的学者之间师承关系的信息,将其清洗、归纳、梳理成师承关系网络,并用富客户端技术直观、清晰、动态地向用户展现具有丰富语义的学者师承关系,并支持一定授权与验证基础上人工修正,为学者科学研究、论文写作、课题申请、扩展学术交往、增进学术友情、密切师生关系提供全面细致的支持。下面是典型的persona:名字:王鸿性别,年龄男,64职业教授、院士生活/工作情况数学领域的资深权威专家,桃李满天下,久负盛名动机,目的,困难功成名就,有时想知道我的学生们正做什么,巡视一下我的学生,但年纪大了,眼花.用户比例典型场景名字:张国栋性别,年龄男,43职业教授
阅读全文
摘要:高德纳的丛书名叫《计算机编程艺术(The Art of Computer Programming)》-- 而不是《计算机编程科学( The Science of Computer Programming)》。 他在1984年获得图灵奖时发表感言说,“计算机编程是门艺术”。程序作为人们思想的结晶,我们不仅要求它可以工作,可以产生正确的结果。我们同时要求它的结构清晰,语法高效,结果美观,能体现出创作者卓越的思想。这一切跟艺术家创作艺术品何其相似。您也许认为这样比喻不恰当,您无法从程序中看到任何美感。这可能是因为大部分人还是看不懂程序,但即使这样,一些伟大的程序还是能让您看到它与众不同的美,高德纳的
阅读全文
摘要:工程师和艺术家—意识软件查尔斯•西蒙尼:查尔斯•西蒙尼,生于匈牙利布达佩斯,原名西蒙尼•卡罗利,软件开发专家,曾任微软公司的产品开发主任。西蒙尼是微软的早期员工之一,他曾在十多年间主持微软办公室软件各个部件程序的开发工作。更多的介绍可以看:http://baike.baidu.com/view/493834.htm今天主要想讲讲查尔斯•西蒙尼的意识软件公司。书中提到:他想提供给主题专家一套工具,主题专家能用这套工具以一种电脑能理解的结构化方式解释自己的意识和需求,最后软件根据这些需求来自动生成相应的软件。而且在意识软件下,你可以修改软件从新到达自己的需求。这个就像建筑师画出一张有魔力自动造出建
阅读全文
摘要:软件设计:要从小处起步,着力考虑细节。软件工程项目的题目已经确定了,现在正处于设计阶段,可是遇到的问题却是很难啊。不知道软件设计怎么做。看到梦断代码中的Chandler项目中的人都是一开始就想吃掉整个庞大的项目,做出很漂亮的设计。基于这个很大的想法,他们一群人就开始了长期的讨论和文档工作,比如说他们的文档架构会议就贯穿了整个2003年夏天,中间有部分员工就是因为觉得进程很慢而转头其他的公司。看来这样的长期的大计划和一直讨论不仅会浪费很多的时间,而且会使员工们失去干活的激情,最后导致项目的失败。所以要从小项目开始,而且永远不要期望它变大。我们的项目同样是这样的,有很多细小的任务和,可以从细节来考
阅读全文
摘要:在软件工程中,当我们的目标定下来之后,团队要有一个整体的计划,对各步骤时间的把握等,有助于我们整个工程的完成。 可是,软件时间,看上去不起眼的问题,确是最难的问题,也是影响整个软件工程成败的问题。 一个本来以为只要4个小时就能完成的问题,6个月都没能解决,Chandler团队可谓深深的体会到了延误带来的苦果,这个小Bug,在工程刚开始时是万难预计到的,当它被发现时,也没有引起足够的重视,最后产生了致命的后果。软件开发者大都认定每个缺陷都可以被迅速修正,且修正旧缺陷必能减少新缺陷的数量。这种盲目乐观,让工程在一开始时就偏离正轨。 那么,如果已经延误了的工程,我们引起重视,补充能力希望能赶上来
阅读全文
摘要:第一个3D游戏的pair project结束后,我们又进行了新的结对编程练习。与上次不同,这次老师为我们提供了完整的test framework,我们无需对整个程序进行设计,只需要实现framework中的调度接口就可以了。具体的作业要求在此:http://www.cnblogs.com/xinz/archive/2010/11/28/1890300.htmlSen为我们完成了framework的编写,在此表示感谢~整个Framework的框架如下Test Framework定义了若干的类比如Building和Passenger以及接口IElevator、IScheduler,IElevato
阅读全文
摘要:电梯调度要求http://www.cnblogs.com/xinz/archive/2010/11/28/1890300.htmlPart 1 framework分析群控电梯调度,需要以下对象:1. 电梯职责:记录内面板状态,判断收到命令是否符合物理规律,执行命令2. 电梯群职责:记录外面板状态(由于是群控电梯,外面板只有一个,由电梯群对象控制)管理电梯,对外交互3. 乘客职责:维护在各个楼层,各电梯内的乘客信息当电梯停止时,完成乘客上下电梯的乘客信息改变给出某段时间内乘客对电梯内外面板的操作信息4. 时钟职责:维护一个系统时间5. 建筑或者说God职责:控制以上对象,辅助完成各方交互除了以上
阅读全文
摘要:随着小游戏的制作的结束,我们迎来了第二个pairproject—编写高效的电梯调度程序。我和Gaoyao同学作为一组,程序已经完成,在这里我们写上对本次pairproject的总结。首先我们完成了邹老师要求的测试接口的编写。我们的测试框架是基于指令触发的,每当有一个乘客(在电梯内或外)按下按钮时,调用一次调度程序。这样的好处是,测试调度程序所需时间只与指令个数有关,不会出现因模拟长时间调度而需大量时间的情况。我们讨论决定了这个框架,最后伪代码由我完成。提交了测试框架的伪代码之后,我们的任务是,根据老师提供的测试框架和接口编写调度程序。老师提供的测试框架是用时间片触发的,据此我们的调度程序分为三
阅读全文
摘要:伴随着 Pair project 1的结束,我和另外一个搭档开始了pair project 2 ,与上次3d桌面游戏开发不同,这次是在电梯调度的framework中完善接口。主要测试的技能:a) Requirement Analysis b) High level design (interface, information hiding, loose coupling) c) Design by contract, d) Implementation skills in C# e) Algorithm design提供的调度接口: a, 乘客(passenger): 来到后立即按电梯,没有
阅读全文
摘要:在建立学术族谱的领域,我们并不是1st mover, 也不是2nd mover,比如说有如下的网站已经在做相关的工作:http://en.wikipedia.org/wiki/Mathematics_Genealogy_Projecthttp://www.arnetminer.org/但是这些网站也不是无懈可击的,比如说他们的产品涉及的领域比较单一,族谱的信息不全面不够准确等。所以如果我们能够提供更全面的信息和更好的平台展示,是可以获得很好的市场的。 我们的开发涉及到的问题主要包括两个方面,即UI的设计和后台族谱信息的挖掘。从要采用的具体技术上讲,并没有什么特别的。在UI方面,我们要做的就是要
阅读全文
摘要:前几个星期,我们组提出了多个团队项目,具体如下:1, 微软学术搜索学生版http://www.cnblogs.com/ustc_msra_ase/archive/2010/12/04/1896480.html 2, 基于用户信息的学术搜索http://www.cnblogs.com/ustc_msra_ase/archive/2010/12/03/1895747.html 3, 多样化信息提供http://www.cnblogs.com/ustc_msra_ase/archive/2010/12/03/1895535.html 4, 学术族谱挖掘http://www.cnblogs.com/.
阅读全文
摘要:MSRA-USTC实验区课程---计算机领域前沿进展第三讲,这次课上我们有幸请到了微软亚洲研究院自然语言处理组蒋龙和刘晓华研究员,为我们带来了在信息膨胀的新时代自然语言处理领域的新进展.
随着互联网技术的不断发展,网络社区,博客等新鲜事物不断涌现.无论是纵谈国家大事,或是分享生活琐屑,已不再需要传统的纸墨笔砚,一切尽在弹指之间. 如今研究员们苦的已不再是数据资料的匮乏,而是如何在海量的数据中择取于我有用的信息,信息的膨胀对于我们来说既是机遇同时也是一种挑战,自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,志于实现人与计算机的有效通信,面对着海量的数据,微软亚洲研究院的资深研究员们是怎样对其加以利用的呢?
阅读全文
摘要:敏捷开发的12准则(这里我们着重于准则4-6):准则4:Business people and developers must work together daily throughout the project.翻译:业务人员和开发人员在项目开发过程中应该共同工作。注释:客户从一开始就参与项目,这意味着开发团队能比较准确地了解用户的需求,能够根据客户的需求变化及时的作出相应的调整,无疑能对客户的...
阅读全文
摘要:1) N (Need 需求) 话说我泱泱天朝每年都有数以万计的青年才俊初涉学术江湖,怎奈武功低微,难免磕磕碰碰,虽说人在江湖漂,哪能不挨刀,但刀挨多了,总是不爽,甚至会挂掉(我是说学术生命,淡定淡定)。于是乎,为学生提供一款披荆斩棘的利器显得分外重要。MSAS和GS虽然功能强大,但面向的是有一定科研经验的研究人员,而并不十分适合刚刚从事科研的学生。学生需要什么呢?学生需要对概念的浅显解释,需要相...
阅读全文
摘要:在这个信息爆炸,而我们还缺乏信息的时代,搜索引擎几乎成了我们日常生活不能或缺的一部分,但是其返回的结果往往不能尽如人意,无法区分相似但不相关信息及无法有针对性的理解用户需求是现阶段搜索引擎的两个大问题。而作为搜索软件的一个特例,学术搜索的结果在这两个方面似乎也没什么长进,甚至更差。比如搜作者,有很多重名的人无法区分,导致一个计算机的研究者名下会有生物的、地理的文章,何其怪哉;搜某一种方法,而这种方...
阅读全文
摘要:我对于学术搜索的想法是在整合多家的搜索结果后提供多样化的信息。有如下几点:提供文章作者的homepage,所在学院或系的homepage。提供人性化和方便的下载按钮。提供除文章以外的相关信息,比如video,ppt等。N (Need 需求)当我们找一篇文章的时候,可能想了解这个作者或他们组的研究情况,从而获得额外的信息。搜索到相应的文章时,需要下载时,我们可以提供方便的下载就好了,而不是一步一步的...
阅读全文
摘要:现代软件工程团队项目并不是随随便便就能决定是否值得去做,现在根据邹欣老师要求的一个框架 (NABC 模型),现在提出我对团队项目的一些初步想法,欢迎大家一起讨论!想法1:完善微软学术搜索(Microsoft Academic Search)的高级搜索界面1) N (Need 需求)目前在微软学术搜索的页面,高级搜索基本上不具备高级搜索功能,还是只能根据类别和时间搜索,不能同时规定需要搜索的某一关键...
阅读全文
摘要:前不久,我们团队在CSDN上发表了一篇关于“机器学习和视觉深度挖掘”的博文,其中比较详尽的列写了当前计算机视觉领域的牛人以及他们的师承关系,在短短一夜之间,访问量超过一千,并被相关领域的海外学者纷纷转载,这让我们想到可以在当前的Microsoft Academic 上添加“族谱挖掘”这一新的插件. 在热心网友和邹欣老师的提点和帮助下,我们重新对其做了一些前景展望与分析:Needs (需求) :有着广泛的用户需求:For 资深专家----桃李满天下: 搜搜看我的学生们都在做什么,取得了哪些成就,关注一下他们的研究现状For 著名学者---学术顶峰期 如何博取百家之长,丰富自己的研究,更上一层楼F
阅读全文
摘要:关于project的idea,我认为可以做一个关于论文的reference提取的软件。1) N (Need 需求)我们在用latex写论文时,如果想要引用一篇论文,那么首先需要拿到它作为reference的bib文件形式。目前该领域主要做法有利用google scholar提供bibtex下载的功能,或者利用IEEE,ACM数据库提供的某些文章的bibtex信息,另外endnote之类的文献管理软...
阅读全文
摘要:Teamproject1:一款学术绑定搜索引擎Microogle学术搜索引擎: 一款集成型的学术搜索引擎,它集成了当今两大学术搜索引擎MicrosoftAcademic search 和 GoogleScholar 的特点,用户只需输入一个关键词,就可以同时得到这两大搜索引擎的结果,给出友好的展现,并添加有一些辅助功能。下面对这款新型学术浏览器的用户需求和前景做一下展望:Need(需求): 当我...
阅读全文
摘要:一篇不错的文章,转一下,大家共享之 这几天有个读者来来去去给我写了几封 email ,问起我的观点:数学和编程是什么关系?学编程需要多深的数学基础?到底需要掌握哪些数学知识,对编程能力的提高有帮助。 这个还真不好说。 如果说起课堂上我们学到的知识。除了初等代数,在编程中我还真没碰到多少依赖数学技能来解决的问题。当年我学 C 语言的时候很小,甚至不知道数学中函数这个概念,还不一样把 C 语言学完...
阅读全文