TeamWork#3,Week5,Performance Test of Crawlers

爬虫总体性能不错,能完成基本的网络数据爬取,没有功能上的缺陷。下图为饿了么网站商户信息爬取结果及原网站信息。

大部分信息是正确的,但也有一些错误。比如下图,小渝馆家常菜和渝码头川菜位置爬取错了。

再比如鑫蜀轩酒楼和久久丫的顺序错了。

 

quantity_sold这一项,有的没有数据,是网站标签的问题,不是爬虫问题。

我们会根据出现的问题,找出程序存在的错误,进一步完善爬虫程序。

posted @ 2014-11-19 17:51  sixsix  阅读(125)  评论(0编辑  收藏  举报