图书爬虫的进展

豆瓣的数据抓取中,豆瓣的反扒措施比较严谨,这里不得已采用了芝麻代理的ip,豆瓣的数据整理的比较好。

另外也对比过京东和当当的数据,发现当当的图书数据是最乱的。

posted on 2019-11-05 15:27  麦克煎蛋  阅读(181)  评论(0编辑  收藏  举报