每日任务内容:

 

 

姓名

今日任务

明日安排

金豪

学习solr使用,明确slor非主要学习工具

了解服务器相关知识,为爬虫服务器的掌握做准备

谷大鑫

阅读数据处理代码

总结出来1.翻译文本代码可重用 2. 数据除噪代码可重用 3. 数据处理不支持中文

尝试编写程序从服务器(数据库)中搜索word文档并且获取文档

杨金键

学习了解了爬虫,联系 到另一个小组,为后续合作工作做准备

开始研究如何处理HTML数据

谢振威

看行一届的数据处理代码

了解学习html语言

崔正龙

阅读爬虫部分代码,了解各个模块大概作用和结构

阅读爬虫中关于word部分,了解数据格式;学习使用C#语言处理word文档

开会照片: (拍摄人:铜鱼)

 

会议记录:

前两天由于大家时间都不太可以凑在一起,所以都没有开会。今日主要任务还是回顾这几天来的收获。另外,随着大家进度的推进,我们首要的目的也越来越清晰:数据处理。从前代码这一块的内容基本等于零,所以这里留给我们的压力还是比较大的。值得高兴的一点是虽然成员有两天都没有进行例会但是今天看来大家的状态都非常的不错,对于各自的分工也都是比较满意且清晰认知的。既然有了清晰的计划,那么下一步就是好好干了,加油