摘要: 爬取代理 Python3中urllib详细使用方法(header,代理,超时,认证,异常处理),详见https://www.cnblogs.com/ifso/p/4707135.html 验证代理 第50行报错,TypeError: cannot use a string pattern on a 阅读全文
posted @ 2017-12-08 15:48 Hyacinth-Yuan 阅读(614) 评论(0) 推荐(0) 编辑
摘要: 爬取更多的items,例如名字,主演,播放次数,电影海报,并进行多页爬取。 items.py youkuMoiveSpider.py pipelines.py setting.py 当然,过程中还是出了不少bug,一部分是不同文件间的类名拼写错误(哎呀,细心细心啊) 一部分是因为python的语法不 阅读全文
posted @ 2017-12-08 15:46 Hyacinth-Yuan 阅读(1244) 评论(2) 推荐(0) 编辑