2013年11月6日

Daily Scrum 11.4

摘要: 摘要:本次meeting的背景为大部分的代码修改工作完成,开始进行最后阶段的代码修改。本次的Task列表如下:Task列表出席人员Today's TaskTomorrow's Task刘昊岩task670网页分析并确定爬取文件类型,修改设计和优化task673地址过滤并确定爬取文件,修改设计和优化task670网页分析并确定爬取文件类型,修改设计和优化task673地址过滤并确定爬取文件,修改设计和优化周萱task680数据库连接,修改设计与优化task682数据库存取,修改设计与优化task680数据库连接,修改设计与优化task682数据库存取,修改设计与优化林谋武task 阅读全文

posted @ 2013-11-06 17:09 远航1617 阅读(153) 评论(0) 推荐(0) 编辑

Daily Scrum 11.6

摘要: 摘要:在本次meeting时,所有代码的修改工作已经接近尾声,接下来是进行的就是单元测试以及进行alpha版本的改进。本次的Task列表如下:Task列表出席人员Today's TaskTomorrow's Task刘昊岩task670网页分析并确定爬取文件类型,修改设计和优化task673地址过滤并确定爬取文件,修改设计和优化task685单元测试与集成测试task690讨论alpha版本存在的问题和解决方案周萱task680数据库连接,修改设计与优化task682数据库存取,修改设计与优化task687单元测试与集成测试task694讨论alpha版本存在的问题和解决方案林 阅读全文

posted @ 2013-11-06 17:07 远航1617 阅读(129) 评论(0) 推荐(0) 编辑

crawler spec

摘要: 使用说明0.写在前面1.本程序完成的抓取网页并保存其文件的工作。2.目前的版本还需将工程文件导入eclipse中运行。3.加载主类MyCrawler生成可执行文件。4.程序主界面:1 准备工作这部分为该程序执行前要做的准备工作。1.1 本地文件路径通过本程序抓取下来的html、pdf、doc、ppt、txt等文件分别存在其对应的文件夹内,路径依次为File\html,File\pdf,File\doc,File\ppt,File\txt,其他可下载文件存入File\others1.2 数据库数据库内存放各种信息。包括:1.被抓取网页的类型、编码等信息;2.文件下载后在本地的存储路径;3.文件的 阅读全文

posted @ 2013-11-06 12:17 远航1617 阅读(188) 评论(0) 推荐(0) 编辑

导航