例会照片

任务更新

姓名 今日完成任务 实际花费时间 明日任务 预计花费时间
谢振威 #4 提取html的编码格式并且处理 4h #4提取更多信息 4h
杨金键 #4 html处理模块 4h #5 看看图片里隐藏了什么神秘代码 4h
谷大鑫 定义处理完成后数据格式以及上传到solr(未完成) 3h #10 整理上届β版本代码,寻找其中连接solr的部分 4h
崔正龙 因为在写编译所以未完成 - #11 重读上届β版本代码中数据处理部分,选择合适的分词器 4h
金豪 #9 学习爬虫数据库相关连接方法并写成文档 4.5h #8 弄清楚爬虫部分主要代码逻辑以及输出部分定义 6h

代码签入

燃尽图