03 2020 档案
发表于 2020-03-19 08:59阅读:1906评论:0推荐:0
摘要:本次过程仅供学习参考,请遵守相关法律法规。 首先我们分析网站:https://www.mzitu.com/all/ 不难发现,这个页面上包含了大量的图片链接,可以说是特别方便我们爬取图片的,这是件好事。那么我们继续分析 这是第一页的地址 这是第二页的,所以我们爬取的时候只需要在链接后面增加“/num
阅读全文 »
发表于 2020-03-18 21:52阅读:316评论:0推荐:0
摘要:什么是Requests Requests是用python语言基于urllib编写的,采用的是Apache2 Licensed开源协议的HTTP库如果你看过上篇文章关于urllib库的使用,你会发现,其实urllib还是非常不方便的,而Requests它会比urllib更加方便,可以节约我们大量的工作
阅读全文 »
发表于 2020-03-18 20:57阅读:594评论:0推荐:0
摘要:如果同一个IP短时间内多次访问统一网页,可能会被系统识别出是爬虫,因此使用代理IP可以很大程度上解决这一问题 常用的代理有: 西刺免费代理:www.xicidaili.com 快代理:www.kuaidaili.com 代理云:www.dailiyun.com 那么我们如何知道自己的代理IP是否已经
阅读全文 »
发表于 2020-03-18 20:56阅读:251评论:0推荐:0
摘要:网络请求的方式 http网络请求有八种 : GET POST HEAD PUT DELETE CONNECT TRACE OPTIONS最常见的请求方式为 GET 和 POSTget:当客户端要从服务器中读取文档时,当点击网页上的链接或者通过在浏览器的地址栏输入网址来浏览网页的,使用的都是GET方式
阅读全文 »
发表于 2020-03-18 18:19阅读:280评论:0推荐:0
摘要:Python 中的变量赋值不需要类型声明。 每个变量在内存中创建,都包括变量的标识,名称和数据这些信息。 每个变量在使用前都必须赋值,变量赋值以后该变量才会被创建。 等号(=)用来给变量赋值。 等号(=)运算符左边是一个变量名,等号(=)运算符右边是存储在变量中的值。例如: counter = 10
阅读全文 »
发表于 2020-03-18 17:53阅读:255评论:0推荐:0
摘要:Python 标识符 在 Python 里,标识符由字母、数字、下划线组成。 在 Python 中,所有标识符可以包括英文、数字以及下划线(_),但不能以数字开头。 Python 中的标识符是区分大小写的。 以下划线开头的标识符是有特殊意义的。以单下划线开头 _foo 的代表不能直接访问的类属性,需
阅读全文 »