北航 2012 秋季 《现代软件工程》 博客列表
如果你写了代码, 但是从来没有实际运行过, 那你究竟写了代码么, 还是在软件工程课上做的梦?
如果你写了文档, 但是从来没人读过, 那你究竟写了文档么?
在我们的课程中, 我们通过实际的项目和公开的博客向世界证明同学们真的写了代码和文档。
团队博客 (5-7人的团队要花10周时间, 分两个阶段, 运用敏捷开发等软件工程的方法论和工具, 完成一个实际的项目)
7 个团队合作完成一个代号为 “學霸” 的 知识搜索问答系统:
· 100Years - 实现网络资源收集工具
每个团队下面的表格是同班其他同学们对此项目Alpha 阶段展示的评价:
1. 无法精确判断网页内容是否与计算机有关 2. 爬取的网页无法保存其URL,目前有所改进 3. 需手动启动并确定所需数量,需起始URL 抓取的页面的URL作为文件名保有,但这个方法可能会产生一些难以处理的问题 基本达到了需求,有些功能如定向爬取以及去除广告还不能实现,讲解比较清楚,主要针对html,对于pdf, ppt等资源展示不够。 爬虫组,对广告可以过滤,不能够保存pdf,ppt等资料。对网页的地址也可以保存,但暂时还无法判断网页质量,下一小组尚未协商接口等问题,必须手动启动。 能够对广告进行过滤。暂时还未能实现判断网页质量,展示时需手动启动,尚未与下一小组协商接口。能够多线程爬取网页。操作界面十分美观。爬取速度在演示时也比较快。 演示效果可以,UI设计也比较美观,但是功能比较简单,对网站中的网页组织的保存不完全,对网页中引用的css, javascript不支持。这对一些动态网站(如renren.com)的爬虫有难度。总体来说还可以,需要进一步完善。 模块划分说明清晰,图形界面简约,功能比较完整。说明在设计阶段考虑周全,清楚,最终基本达到了要求。视频的效果不是很好。 大致描述了爬虫的工作原理,所需事项,通过媒体描述了爬取过程。解释较为清楚。能够处理简单的相关性判断,爬到所需数据,并且保存了URL(但未完美保有(被过滤掉字)),与下一个小组类似,宽度优先算法个人觉得第二组稍好一点。 目前无法由网页内容进行质量判定。可过滤广告页(通过AD字段),广度优先搜索,收集网页为原始网页,未进行进一步处理。暂时没有资源文档(pdf, word)等(可以有),网页原始URL未保存下来。有界面,爬取问题10000 还无法识别网页的质量,无法有效获得指定的文件,比如广告,广度优先只收集到网页,没有保存URL。界面比第二组好看,没有进行更多的操作。没有更新网页的判断。希望能继续处理网页。
|
· 76er - 实现网络资源收集工具
能够通过界面显示当前进程数,可以保存uml,可以过滤广告,但可能会产生误判。对于网站更新后的重新爬取,还没有完全做到。没将不同类型的文件分类存放,程序好像也不能自动启动。 演示效果也是视频,UI设计不如上一个,但是对于状态的表示比上一个要好一些。该小组实现的功能与上一个相同,但对pdf, ppt等类型的文件支持更佳,这一功能上一小组也有实现。对网页组织、URL保存不佳。 视频清楚,但解说略显不足。双队列的想法解决了深度优先爬取的构想,和另一爬虫组的方法不同。功能基本达到要求。过滤广告的解决方法不是很好。 能设定总数,初始URL,解释爬取较为详尽。与上一个小组类似,采用了宽度优先的做法,同样也能保存pdf,还能保存ppt。据自述,能做一定程度的过滤。能抽出QA对网页,据描述,还不能完全标记带QA对网页,无法处理有用链接中的一些无用信息,但提出了一些构想。 有界面,可显示进程数。不仅可以收集HTML网页,同时可以下载pdf等资源文件。现在通过URL字段过滤广告页。暂无法处理无用的子链接。爬取10000英文网页,5000多中文网页。 建议:过滤掉无意义链接。 界面不如第一组好看,线程直接显示,宽度优先,但是算法思想比第一组更清楚,没有判断过滤系统,都是只有网页。没有更新网页判断。希望对网页进行进一步处理。能区分更多的信息。
1. 需手动启动 2. 需起始URL 3. 不如第一组,将资源分文件夹存放 未对广告页面进行处理,或者说处理不干净 对程序运行时内部的情况展示较全面,准确度比较高,但所有下载下来的html, pdf等混在一起,也许对于使用者而言不是很方便。对于某些无用的网页处理不是很完善,需要进一步调整和过滤。 功能达到了需求,可以根据需求定向下载指定网站,pdf, ppt资源文件充足。但去除广告效果较差,无法完全准确分析是否为有关网页。但整体效果尤其问答对效果还不错。 有界面,并可显示当前进程数,可以保存uml,并可以保存pdf, ppt到本地,通过uml过滤广告,但容易错杀一些所需网页,对于网页的更新尚无法重新获取。
|
· TeamSH*T - 网络资料的元数据抽取和整理
1. 未解决编码问题 2. 写入数据速度慢,数据库操作不完善 3. 网页部分信息不能抽取 (你们的网页信息抽取是什么算法) 效率不够高,特别是在数据库操作上有一定问题。对字符处理比较不错,去噪做得比较好。展示了对爬虫爬取的数据的处理。但是缺少对功能的实际演示。 没能现场展示实现过程,但解说文档较为充分,解说较详细。但目前未能处理完全部网页,pdf还不能提取出内容。提问对能较好抽取出来。没有做出英文网页抽取。 处理HTML,处理了编码问题,能够给文件加标签,但是对于pdf等文件的标题内容等无法提取,测试用例主要来源于以上两组,但没有自己写出相关测试用例来测试。 没有进行现场演示。能够给文件添加标签,但不能通过读取pdf内容获取pdf的标签。能够进行去噪,效率不够高。在数据库上有一定问题。 没有演示效果,虽然测试效果不错,也找到了不少bug,但是功能比较简单,只支持特定网页,不支持pdf, ppt等格式。用正则表达式也限制了网站的选择,解释较为详细但问题也很多。 与上两组类似,没给出实际成品,只有测试报告(上两组有爬取结果)。解决了一些比较简单的问题(编码转换、绝对路径),还不能提取标题、关键词等其它形式,未做排序测试,大致完成了任务。但对于海量数据,个人认为正则表达式不适合匹配。还在运转,仍未完成。(实际未完全) 处理RamHTML,处理了字符编码的问题。信息抽取:对pdf不处理。数据库输入方式有些问题(速度较慢) 去噪结果一致,字符问题。抽取元数据的效果一般。数据库操作问题。Pdf元素抽取有很多问题(几乎没有)。网页数据提取不是很成功,测试做得也一般,部分QA对。希望能进行下一步的针对性处理。
|
· FightingSnail - 网络资料的元数据抽取和整理
只能处理中文数据,暂时无法处理英文数据。数据库整体做得比较好。问题在于对需求分析理解有问题,导致做出的东西存在不少问题。还需要进行完善。 界面没有完全做出来,如命令行参数。没有做出英文网页抽取。有手工加进去的成分。解说不够详细。QA对不能抽取问答对,需求理解不完全正确,但更改很容易。 暂时不支持英语网页的整理,无法全部抽取元数据。暂时无法抽取问答信息,通过网站UI展示数据库内容,主要由于没有完全理解用户需求,望注意 暂时不支持英语网页的整理,暂时无法抽取问答信息。在对于需求分析理解时存在问题,导致做出的结果还不能被其它小组使用。整体的基本功能还没有完全实现,有待继续修改 效果比上一个要好,也有现场演示,不仅做了元数据的抽取,而且通过刚在对抽取到的数据进行展现。框架设计的比较好,但没有用到专门的元数据提取算法,比较可惜,总体比较好 图形界面效果不尽如人意。在设计阶段考虑不太周全,对用户需求理解有一定错误,导致最终功能实现有一些缺陷。但是数据的去噪、存储基本功能已实现。希望能在下一版本改进 算法根据词语词频,未采用TIFTD算法,给出了一个控制台测试。能够抽取展示结果,因为针对任意网站,导致项目出现问题,未能成功部署是硬伤,有关键词功能,与上一组一样,实际上耒完全完成 抽取了关键词(反对中文网页),现在不能提取出Question Answer 通过网站UI展示数据库内容 建议:对特定网站抽取QA对,英文网站提取关键词(可以TFIDF),抽取pdf信息 能处理中文的部分网页,抽取关键字,但是不能抽取QA对,不能部署到服务器上。简单的UI展示数据信息,增加对英文网页的分析。计划做得好。需求分析做得好。增加更好的体验
|
· MagicCode - 网站 UI
1. 页面简洁 2. 能完整显示各个方面的东西 3. 编程能力很强 4. 能够中英文切换 很完美 界面简洁,同时清晰明了,能让用户很容易地找到自己需要的信息。功能完善,提供中英两种UI。暂时存在的问题是对种类浏览器的兼容性还不算最佳,但总体效果已经很不错。 小组只有3人,已配置在服务器上,页面排版比较清楚,功能比较全面,可自由切换中英文,但标签没能实现中英互译,但网页创新度不高,配色不是符合美学。 已经部署到服务器,各种页面之间无闪烁,支持各种标签分类,具有回答和评论功能。具有中英文切换功能,对于 pdf等文件可以提供在线浏览功能,完美支持IE7以上浏览器 已经将项目部署到服务器,页面风格十分美观,具有回答和评论的功能。具有中英文切换的功能,能够对pdf提供在线浏览功能,暂时只支持ie7浏览器 Metro风格非常清新,也使用了一些流行的技术,用户体验较佳。功能也较为完善,对评论、pdf显示、分类、打分等都支持得较为完善,只有3个人的小组,能做到这些很不容易,不支持IE6是一个遗憾 界面友好,清楚,功能相当全。考虑周全,模块划分明确,组员分工明确,比较合理。讲解效果很好。服务器设置使相关团队能方便地整合 首页展示比较漂亮,各种页面之间的跳转无缝衔接。Pdf可以在线浏览。回答,评论框ajax。中英文切换。支持手动切换。 中英文切换,pdf在线浏览,页面炫丽,功能也不错。一定要找缺点的话可能比较乱一点,最好是能更加清晰一些。
|
· 代码厨房 - 网站 UI
1. 没有的很大的瑕疵 2. 修改密码,密码找回 3. 界面过分简洁,感觉很粗糙 4. 不可查询用户回答过的问题 界面稍显简单,实现的功能也不多,感觉不是用户会特别喜欢的风格。对用户信息的保存还不错,但是对对数据库中信息间关系处理也不够完善,可能是因为大量信息运行在后台的缘故,展示的内容偏单薄。 功能比较简单,还不能更改邮箱,进行了加密处理,还不能更改中英文,只能实现基本页面功能,不能提交头像数据库处理展示不全面。但是逻辑比较清楚。 用户注册在修改个人信息时尚无邮件难功能,MD5加密,无法插入超链接,无法提交头像,将用户回答和用户信息存入数据库,暂无支持对用户的历史回答查询。 存在一些可以继续完善的功能,如修改密码需邮箱确认的功能。有中英文界面。基本功能大部分能够实现。对于图片,链接等功能还需完善。数据库有加密,界面风格需完善。 与上一小组对比明显不如上一小组,几乎没有UI之说,只有几个链接,功能较为完善,如登录、提问等都有支持。但是其它功能,如rss、邮件功能均不支持,也没有用到ajax之类的效果,用户体验不佳。 用户信息比较完整,积分和等级的想法有创新。注册和修改信息的功能实现比较完整,用户体验比较友好。但还有一些非关键功能未能实现属美中不足 登陆界面还不错,邮箱功能还未实现,对密码有随机保护功能。并且做了部分后台功能,整体完成还不错,存在一些问题:没有必要的返回按钮,这样在多次键入用户密码时,后退键需要多次,这个不太好。 简单,但是确实跟上一组相差了一些功能 ,太简单,太基础。只能进行文字工作,没有图片。后台做了很多,包括各种回复。希望多一些邮件的功能,增加密码确认和图像。
|
· DOOM CSE - 网站 UI
1. 查询结果时间效率低,准确率不高 2. 页面不是很美观 3. 压力测试不合格 希望界面更加好香 界面明了简洁。搜索效率较低,运行起来较慢。在少量记录中搜索特定词汇都需要较长时间,而且准确率不是太高,相关度还不错。功能过于单一。 搜索比较慢,不符合用户需求,搜索算法精度不高,数据太少,没能全面用到倒排表,上传界面太过朴素,简单。测试不全面,高于25个用户,网站崩溃。但基本搜索功能实现了 实现搜索功能,但是稍有些慢,实现上传功能,但界面稍显简陋。尚无高级搜索功能,尚未进行压力测试,在Beta版需要改进搜索算法,匹配算法等。 界面比较简洁。但是目前的运行效率还比较低。能够实现上传、下载、搜索功能。尚无高级搜索,尚未进行压力测试。搜索的相关度还是可以接受的。但是还需进一步完善 页面与上上一小组类似,但细节有待完善,查询效率不佳,存在一些bug,搜索效果一般,还拥有上传、下载功能,但UI十分简单,没有高级搜索功能,不能对搜索结果排序,多用户负载能力不佳 界面清楚,搜索功能基本完整。但是搜索耗时比较长,结果不尽如人意。希望第二版本优化算法。讲解有时不太清楚。总体基本可接受,仍需强化 算法较慢,分词和排序存在一定问题,在128个文件(数据量下)运行时间实在太长。上传也未添加限制,完成的功能实际上很少。未实现排除算法和条件搜索。总体来说大致完成了任务。(PS: 我做了整体负载测试,很快就因为搜索功能而崩溃) 结果较准确,速度较慢,算法须改进,暂时不支持高级搜索功能。 文件上传,界面略简陋。 建议:增加高级搜索(tag,时间,作者等),优化界面,优化算法。 网站搜索,信息搜索,速度有点慢,没有高级搜索 |
下面的团队做其它项目, 贴近生活, 解决大学生的实际问题:
· Shine - 改变世界的 STG 游戏 - “打飞机”
1. 玩法新颖 2. 画面质量不错 3. 暂无排行,积分记录等 4. 期待一些声音效果 希望增设难度选择 游戏创意比较好,准备做的功能也较多,一大亮点是可以跨平台运行,解决了现在游戏普遍存在的可移植性方面的问题。但是现阶段的成果还不够炫,可能无法展示“改变世界的游戏”的潜力。 设计比较新颖,但展示起来并不很具有突破性,能够实现两个平台,画面还比较简单,飞机模型看着有立体效果。没有展示得分榜和其它道具等更多功能。但流畅性不错。 提供了全新的射击模式,尚不提供积分榜功能,提供该类游戏常见的功能,但没有血条,AI稍弱,用户久了可能会失去兴趣,在下一版本有待改进。 最大的亮点是可以跨平台运行。游戏的创意确实不错。但是目前只实现了一些基本的游戏功能。因此,目前的演示结果,我们不足以对其进行全面的评价。希望这个游戏能够做到“改变世界” 游戏十分新颖,动画效果很好,但目前仅是一个Demo版本,玩法还不是很丰富,目前已经具有一定的可玩性,防守、攻击都具备,性能很好,没有卡屏现象发生,是一个可以改变世界的游戏 游戏方式比较特别,有一定创新。界面比较炫目,基本的同类游戏元素都可以在界面中找到。同时有IOS和Android版本。可以考虑增加其它元素以丰富游戏体验 游戏模式比较新颖,能在电脑和手机上运行,好吧,还有大招。。。没有血条,不知道能否升级。总体来说还是挺有意思的,(神啊,让我凑够70字吧)没做过游戏不知道难度,因为创新的关系给高分,希望添加更多功能 改变世界的STG,跨平台(ios, android),效果较华丽(爆炸效果,冒烟效果)游戏形式新颖。目前没有用户积分榜 游戏只能演示,缺少各种吸引人的东西
|
· superbro - 英语背单词助手 - 在原有版本基础上开发新版本
1. 可扩展性高 2. 词库扩展,多了背单词模式 3. 背单词误选后不能返回 4. 感觉界面粗糙 查询单词时效率低 软件兼容性不好,在某些系统下不支持,现场演示也暴露了这个问题。界面布局存在一定问题。测验功能做得比较好,对内部算法的处理比较不错,修正了前一版本的各种bug。其它功能还待展示 目前WIN7还不支持,兼容性不好,用了不少调度时间,增加了词库,组员还不会使用,界面没有更改完毕,不能返回上一题。改进了逻辑结构,可增加所有词库,但牵扯到道德问题。功能还不完善 添加了更多词库,需要.NET4.5,可以选择题目难度和题目个数。统计,设置等功能还没有实现。 软件的兼容性还有待提高。相比于前一个版本添加了更多的词库。可以选择题目的难度和题目个数。但是还有几个功能并没有实现增加了课程选择功能,希望能够增加一些更吸引用户的特色功能 功能较为完善,数据很丰富,有很多的词库,可供使用,UI设计的比较好,虽然有一些小问题,可用性不错,运行得比较流畅稳定,但是数据是从其它软件中盗版来的,这不是一个好方法 界面简约清晰,对于前一版的改进值得肯定,效果明显。功能完整,可添加词库的功能比较方便。还可考虑添加更多功能以完善软件,使用户有更佳的体验 从原软件出发,界面风格很漂亮,功能也不错。违反了《软件工程师的道德》一章(纯属凑字)。设计还未完全完成,用了前人的东西(好还是不好呢?)增加了词库、课程选择,赞一下。希望能添加后续功能 需要.NET4.5,支持多词典,用户添加词典,选定特定词典进行测试(考试)。软件框架可扩展性好。目前记忆统计功能无
|
· www-Buaa - 学生时间管理助手 - 在原有版本基础上开发新版本
1. 改进了页面风格 2. 图标改变很不错 3. 优化作得非常全面 4. 增设快捷键 5. 小按钮处理不好 总览事件时,时间效率不足 UI风格比较统一,使用起来易于上手,功能完善。作为一个桌面小工具来说,界面简洁明了,占面积也不大。对软件的后续功能有明确期望。暂时存在一些bug,但整体感觉不错 改进了图标,重新进行了界面设计,更改了后台数据库,增加了一个直观的计划表。更改了细节和增加了控制键,还有不少bug,如内存使用。做的事情不是很多,没有使用单元测试 统一了UI的风格。目前的风格十分统一。界面清新简明。功能十分多。之后还可以将它敲定为一个桌面的小工具。Bug修复得比较完善,添加了课程表功能,软件更加个性化 主要对以往的项目进行改进,但是改进不大,主要是对UI的修改和对bug的修复,对数据库的支持有所提升,出现的bug比较多,未完成的功能也很多,总体来说工作量略小,需要提高,建议增加一些功能 界面小巧,分区清楚。对于用户界面的改进很有效果,汉化使用户使用更方便。对于内部数据结构的改进值得肯定。新加入的日程表功能很有用。对于内存占用还需改进以使软件更实用 改变了UI,改变了语言,改变了数据结构,统一到了SQL数据库。窗口的Tab键切换更改,还有谷歌同步,周表扩展等,消耗资源问题定在桌面,想法不错,想法不错,缺少皮肤,暂时不能做到,总体不错。 统一UI,类WIN8直角UI。数据统一至SQLite,精简冗余代码。增加一周计划显示。增加快捷键。皮肤换色(预计支持) 建议:增加隐藏功能(类似QQ) 统一UI |
与此同时, 每个学生在自己的博客上发布其它个人作业 , 程序, 阅读, 总结等: