例会照片
任务更新
姓名 | 今日完成任务 | 实际花费时间 | 明日任务 | 预计花费时间 |
---|---|---|---|---|
谢振威 | #13上传数据到solr | 4h | #19清理solr,创建新索引,将网站地址和网站名字上传 | 3h |
杨金键 | #14针对一些频度较高的特定网站提取其tag | 2h | #24探究 降噪 实现原理 | 2h |
谷大鑫 | #15整理上届源代码,寻找其中冗余部分以及短缺之处 | 3h | #20进行网页与后台交互代码实现研究 | 3h |
崔正龙 | #21 把之前写的部分移植进来,解决找不到库的问题 | 3h | #22将文本中关键词提取,去除多余词汇,并翻译关键词,存入数据库 | 3h |
金豪 | #18 调通爬虫脚本使得其正常工作 | 3h | #25 完善爬虫部分 更改bug 提升效率 | 3h |
代码签入
代码都在服务器上,所以对于服务器代码的修改没有反应在github上面