摘要:
### 官方文档:https://docs.python.org/zh-cn/3/library/urllib.request.html#module-urllib.request # urllib模块介绍: 一共是四块, urllib.request - 打开和读取 URL。 urllib.err 阅读全文
摘要:
### 这是使用的urllib, #### 使用requests下载图片 import requests # 这是一个图片的url url = 'http://yun.itheima.com/Upload/Images/20170614/594106ee6ace5.jpg' response = r 阅读全文
摘要:
### # 序列化是什么? 现在的序列化都是转向一个字符串数据类型, 我们说的序列就是字符串, # 为什么要千方百计的转换成为字符串呢? 是为了存储和传递 如果一个字典{"k":"v"}为什么要转成字符串 1,我往文件或者数据库里面写内容的时候是不能写入字典的,可以写入字符串, 2,还有在网络上传输 阅读全文
摘要:
#### 进入虚拟环境,里面安装了scrapy, 进入命令行,输入命令,scrapy shell 'https://scrapy.org' --nolog,执行后,会自动将指定 url 的网页下载下来, 注意一点:不要在你的爬虫项目文件夹下面执行这个命令,会报错的, 会弹出交互页面, 然后你就可以使 阅读全文
摘要:
#### 在爬虫里面,使用yield,就是协程异步的体现, 所以我干保证,面试的时候一定会涉及到线程,涉及到协程,的使用,这个必须要深刻的理解, #### 必须要搞定这个线程协程,然后还有就是这个框架,然后你才能自定义,才能扩展这个框架, ##### 阅读全文