摘要:
一、代理: 1、是采用代理服务器的方式来访问服务器,以防止服务器封住本机的ip地址。 二、urllib库使用: 1、获得response对象: (1)方法: (1)status (2)getheaders() (3)read() (4)getheader(headername) (2)、参数: (1 阅读全文
摘要:
一、最近在学习python爬虫的时候需要用到tesseract,但书上的给的教程对我并不适用,坑了好久天,才终于成功。 二、方法: 1、由于我看的是静谧博主的那本书。他给的教程在python3安装有问题。 2、步骤: (1)首先安装tesseract按照默认安装,可以不用下载所有的语言。 (2)pi 阅读全文