摘要: 一、代理: 1、是采用代理服务器的方式来访问服务器,以防止服务器封住本机的ip地址。 二、urllib库使用: 1、获得response对象: (1)方法: (1)status (2)getheaders() (3)read() (4)getheader(headername) (2)、参数: (1 阅读全文
posted @ 2018-11-13 21:39 monty12 阅读(117) 评论(0) 推荐(0) 编辑
摘要: 一、最近在学习python爬虫的时候需要用到tesseract,但书上的给的教程对我并不适用,坑了好久天,才终于成功。 二、方法: 1、由于我看的是静谧博主的那本书。他给的教程在python3安装有问题。 2、步骤: (1)首先安装tesseract按照默认安装,可以不用下载所有的语言。 (2)pi 阅读全文
posted @ 2018-11-13 16:23 monty12 阅读(2037) 评论(0) 推荐(0) 编辑