摘要: 起因 有个朋友叫我帮忙写个爬虫,爬取javbus5上面所有的详情页链接,也就是所有的https://www.javbus5.com/SRS 055这种链接, 我一看,嘿呀,这是司机的活儿啊,我绝对不能辱没我老司机的名声(被败坏了可不好),于是开始着手写了 构思 爬虫调度启动程序crawler.py 阅读全文
posted @ 2016-12-06 18:22 Akkuman 阅读(539200) 评论(2) 推荐(0) 编辑
摘要: 百度云限速比较坑,现在基本200k左右 很多人都知道了,但是总有朋友问我,我说明一下 首先下载IDM(最好支持正版) 下载链接: "百度云shaoit" 开始下载: 一般的话,小文件直接打开浏览器就可以下载 大文件下载: 首先在chrome浏览器中装上一个User Agent Switcher fo 阅读全文
posted @ 2016-12-06 14:33 Akkuman 阅读(926) 评论(0) 推荐(0) 编辑
摘要: 问题出现: You must not use 8 bit bytestrings unless you use a text_factory that can interpret 8 bit bytestrings (like text_factory = str). It is highly re 阅读全文
posted @ 2016-12-06 14:31 Akkuman 阅读(828) 评论(0) 推荐(0) 编辑