摘要: ### 官方文档:https://docs.python.org/zh-cn/3/library/urllib.request.html#module-urllib.request # urllib模块介绍: 一共是四块, urllib.request - 打开和读取 URL。 urllib.err 阅读全文
posted @ 2021-09-11 22:40 技术改变命运Andy 阅读(29) 评论(0) 推荐(0) 编辑
摘要: ### 这是使用的urllib, #### 使用requests下载图片 import requests # 这是一个图片的url url = 'http://yun.itheima.com/Upload/Images/20170614/594106ee6ace5.jpg' response = r 阅读全文
posted @ 2021-09-11 22:39 技术改变命运Andy 阅读(114) 评论(0) 推荐(0) 编辑
摘要: ### # 序列化是什么? 现在的序列化都是转向一个字符串数据类型, 我们说的序列就是字符串, # 为什么要千方百计的转换成为字符串呢? 是为了存储和传递 如果一个字典{"k":"v"}为什么要转成字符串 1,我往文件或者数据库里面写内容的时候是不能写入字典的,可以写入字符串, 2,还有在网络上传输 阅读全文
posted @ 2021-09-11 05:05 技术改变命运Andy 阅读(68) 评论(0) 推荐(0) 编辑
摘要: #### 进入虚拟环境,里面安装了scrapy, 进入命令行,输入命令,scrapy shell 'https://scrapy.org' --nolog,执行后,会自动将指定 url 的网页下载下来, 注意一点:不要在你的爬虫项目文件夹下面执行这个命令,会报错的, 会弹出交互页面, 然后你就可以使 阅读全文
posted @ 2021-09-11 03:12 技术改变命运Andy 阅读(106) 评论(0) 推荐(0) 编辑
摘要: #### 在爬虫里面,使用yield,就是协程异步的体现, 所以我干保证,面试的时候一定会涉及到线程,涉及到协程,的使用,这个必须要深刻的理解, #### 必须要搞定这个线程协程,然后还有就是这个框架,然后你才能自定义,才能扩展这个框架, ##### 阅读全文
posted @ 2021-09-11 02:40 技术改变命运Andy 阅读(49) 评论(0) 推荐(0) 编辑