摘要:
作业要求:http://www.cnblogs.com/xinz/archive/2012/10/14/2723635.html 第2次阅读作业要求阅读6篇文章: 1No Silver Bullet: Essence and Accidents of Software Engineering(没有银弹:软件工程的本质和偶然) 这篇论文的作者是Frederick P. Brooks, Jr.,曾在IBM任要职。文章的标题译法很多,Essence and Accidents译为本质与偶然基本是直译,《没有银弹:软件工程的本质性与附属性工作》这种翻译更为恰当。文章第一句就说明了何为银弹:只... 阅读全文
摘要:
@TeamSH-IT今天整合出的结果中,由于编码方式的不确定,部分结果出现乱码。明天争取要实现编码转换。详细的完成情况:组员今天任务明天任务Hu Renjun任务213整合各个模块功能完成完整的数据流过程任务 88整合个模块功能,寻找bug,完善细节考虑翻译和标签Peng Xiaodong 任务87 完善UI调试任务87 完善UI调试Lian Zhaopeng任务88 暂时放下对去噪优化,主要查找一些翻译信息任务88 继续昨天工作Li bin任务83 数据处理——抽取有用信息继续完善代码任务83 数据处理——抽取有用信息继续完善代码Sui Yuhao任务86 保存数据调试代码,找出... 阅读全文
摘要:
@TeamSH-IT今天经完成了之前在数据定义存在一些问题。sui老师经过小组之间的交流,完成了对数据定义的最终版。周末将进行初步的整合和测试。详细的完成情况:组员今天任务明天任务Hu Renjun任务213整合各个模块功能完成完整的数据流过程任务213整合各个模块功能完成完整的数据流过程Peng Xiaodong 任务87 完善UI完善加入信息的传递过程任务87 完善UI调试Lian Zhaopeng任务82 88一方面继续去噪查找关于翻译的信息任务88 暂时放下对去噪优化,主要查找一些翻译信息Li bin任务83 数据处理——抽取有用信息调试任务83 数据处理——抽取有用信息继... 阅读全文
摘要:
@TeamSH-IT今天经过讨论发现之前的数据定义存在一些问题,又修改了一次。这次下定决心不能再改文档了,所以讨论地很细致。详细的完成情况:组员今天任务明天任务Hu Renjun任务213撰写technical Spec——系统框架图,细化各个功能模块整合各个模块功能完成完整的数据流过程Peng Xiaodong 任务87 完善UI加入信息传递过程(初步)任务87 完善UI完善加入信息的传递过程Lian Zhaopeng任务82 88一方面继续完成去噪改良一方面研究翻译研究去噪主要是在编码问题任务82 88一方面继续去噪查找关于翻译的信息Li bin任务83 数据处理——抽取有用信... 阅读全文
摘要:
@TeamSH-IT今天各成员将他们完成的部分签入TFS。详细的完成情况:组员今天任务明天任务Hu Renjun任务213撰写technical Spec任务213撰写technical Spec——系统框架图,细化各个功能模块Peng Xiaodong 任务68 前期UI设计初步小范围的数据测试检查UI的基本功能任务87 完善UI加入信息传递过程(初步)Lian Zhaopeng任务82 数据处理——去噪完成对单个文件的处理。为批量处理做准备Li bin任务83 数据处理——抽取有用信息继续完成代码,作出Q&A部分任务83 数据处理——抽取有用信息完善代码Sui Yuhao任务6.. 阅读全文
摘要:
1 项目背景Project: Building Online Education Q&A ecosystemOur Task: Content schema definition &Content Pipeline 要求:定义这个网站需要的内容结构, 并从爬到的内容中抽取元数据 (meta data), 并支持标签, 翻译等功能。 a.Define a schema of "online education Q&A",find out entities and their relationships. b.Input new content into 阅读全文
摘要:
In this case, we are going to write a spec. Suppose there is a English-speaking alien, and he is unable to tie his shoes. So we have to write a short, simple spec to show him how to tie the shoes.We can also add some pictures in the spec.Spec: How To Tie Your Shoes This method is divided into 11... 阅读全文
摘要:
@TeamSH-ITdaily scrum虽然以为号称周末的缘故暂停了,但是进度并没有放下!写daily scrum的人换了啊换了啊...讨论中提出的一些问题及解决方法:HuRenjun对项目的需求忽然有些模糊,这个Online QA System主要功能是基于搜索引擎的QA对提取查询还是基于数据挖掘的类学术搜索系统。讨论结果:学术搜索功能只是本系统的一小部分,主要的还是基于QA对的查询。详细的完成情况:组员今天任务明天任务Hu Renjun任务213(这个ID伤不起)撰写technical Spec任务213撰写technical SpecPeng Xiaodong 任务68 前... 阅读全文
摘要:
@TeamSH-IT讨论中提出的一些问题及解决方法: 问题:LianZhaopeng提出了一个疑问,爬虫部分是搜集网页链接还是会将网页下载下来。 小组讨论结果:我们问了一组爬虫组的同学,说是会将网页下载。因此LZP又多了一个任务——提供一个文件夹地址,获取此文件下的网页文件。听说他去噪已经基本完成了,赞一个!详细的完成情况:组员今天任务明天任务Hu Renjun任务84 数据处理——整合收集 整理一些Key Data调试去重功能,并完善 任务84 数据处理——整合搜集数据分类方法Peng Xiaodong 任务68 前期UI设计完善UI自己做测试数据任务68 前期UI设计... 阅读全文
摘要:
@TeamSH-IT讨论中提出的一些问题及解决方法: 问题:Hu Renjun要先实现了一个简单的问答去重,但是没有数据来测试呀!而且我们在开发的过程中,爬虫组并不会提供他们爬取的结果,那我们的测试数据怎么搞定? 小组讨论结果:HRJ如果需要可以自己手动去搜集几个数据,在Lian Zhaopeng 和 Li Bin开发的功能实现后,我们应当收集一些数据并存入数据库中,方便系统整体的调试和以后的功能演示。 问题:譬如百度知道等问答网站,一个问题可能拥有很多回答,需要保存多种回答么? 小组讨论结果:暂时只保存一种,在信息抽取部分要尽量抽最佳的回答。详细的完成情况:组员今天任务明天任务Hu ... 阅读全文