软件发布及用户测试报告(beta版)

  说实话,我们的这个软件真的不太好单独发布。本来想叫上爬虫组和UI组一起整合后联合发布,但是整合的结果不太好。正好我们也做了图形界面,就单独发布吧。等所有组完全整合起来后,应该会是一个不错的网站。

  界面没有变化,但是内部是完全重新写的。第二阶段两个pipeline组做了分工,我们负责网页部分的提取,另一组负责PDF和问答部分。对数据格式我们做了一些改进,比如每个网页有四个标签,每一个标签对应一个preview。这个preview的目的是提供在网页内容中,标签词汇附近的内容预览。类似于搜索引擎的预览功能。

 

图1 百度搜索的预览

图2 选择网页的一个标签,查看其附近内容

图3 图形界面

 

  但是最终的提取结果是好是坏,还需要用户来评估。不像学生时间管理助手、背单词软件这些小组,我们的工作只是“学霸”网站的中间一环,个人觉得想要进行用户测试还是比较困难。所以在用户评估过程中,我们需要解释的东西比较多,用户也需要了解很多东西才能知道我们的工作究竟是什么,效果是怎样的。因此提一个意见,有些要求是不能一视同仁的,比如有些小组的软件适合做用户测试,有些小组的成果称为软件有点牵强。希望任课教师能因地制宜,不是一味的追求平等。

  以下是用户的一些感受和评价:

  选择一个网页点击Process后处理的时间比较长,看了一下原始网页,基本是内容的多少决定了处理时间的长短。不知道最终“学霸”网站的数据是pipeline组一次存进去,还是始终在处理,或是有数据更新间隔,每隔一段时间添加一次数据。但是无论是哪种方式,都需要提高效率。

  网页的内容提取的还是比较完整,多数无关内容都去掉了。标签的选取貌似是根据次品统计的结果,一些像“的”、“the”、“a”这样的词都过滤掉了,效果还是不错的。预览功能最终如果能实现在网站上是个很好的创意。

posted @ 2012-12-17 01:32  teamshit  阅读(1409)  评论(1编辑  收藏  举报