例会照片
任务更新
姓名 |
今日完成任务 |
实际花费时间 |
明日任务 |
预计花费时间 |
谢振威 |
#4 提取html的编码格式并且处理 |
4h |
#4提取更多信息 |
4h |
杨金键 |
#4 html处理模块 |
4h |
#5 看看图片里隐藏了什么神秘代码 |
4h |
谷大鑫 |
定义处理完成后数据格式以及上传到solr(未完成) |
3h |
#10 整理上届β版本代码,寻找其中连接solr的部分 |
4h |
崔正龙 |
因为在写编译所以未完成 |
- |
#11 重读上届β版本代码中数据处理部分,选择合适的分词器 |
4h |
金豪 |
#9 学习爬虫数据库相关连接方法并写成文档 |
4.5h |
#8 弄清楚爬虫部分主要代码逻辑以及输出部分定义 |
6h |
代码签入
燃尽图
|
|
|