摘要:
[toc] 1.什么是cookie? 在网站中,http的请求是无状态的。也就是说即使第一次和服务器连接后并且登录成功后,第二次请求服务器依然不能知道当前请求是哪个用户。cookie的出现就是为了解决这个问题,第一次登陆服务器返回一些数据(cookie)给浏览器,然后浏览器保存到本地,当该用户第二次 阅读全文
摘要:
[toc] 很多网站会监测一段时间内某个IP访问的次数(通过数据流量和日志等),如果访问的次数多的不像正常人,它就会把这个IP地址封了。所以我们就需要设置一些代理服务器,每隔一段时间换一个代理,就算IP被禁止,依然可以换个IP继续爬。 常用的代理服务器: 西刺免费代理IP:https://www.x 阅读全文
摘要:
[toc] 需要操作Excel,那么首先需要的操作工作簿对象,这是Excel的根本,以下是集中操作方法。 1.创建工作簿 1.1 直接使用 没必要先在文件系统上创建一个工作簿,然后再操作它,在Python中可以直接导入Workbook类并开始使用 1.2 创建的工作簿至少含有一个工作表 1.3 创建 阅读全文
摘要:
[toc] 1.安装第三方库 1.1 常规安装 1.2 快速安装 切换到国内的镜像源,速度相对会快些,国内镜像源如下: (1)阿里云 https://mirrors.aliyun.com/pypi/simple/ (2)豆瓣 https://pypi.douban.com/simple/ (3)清华 阅读全文
摘要:
[toc] 1.urllib库简介 库是Python中一个最基本的网络请求库,可以模拟浏览器的行为,向指定的服务器发送一个请求,并可以保存服务器返回的数据。 2.urlopen函数 在 的urllib库中,所有和网络请求相关的方法,都被集成到 模块下了,下面是urlopen函数的基本使用: 上述代码 阅读全文