随笔档案「2021年9月11日」：4-06python语法基础-内置模块-urllib模块 ... - 技术改变命运Andy

2021年9月11日

摘要： ### 官方文档：https://docs.python.org/zh-cn/3/library/urllib.request.html#module-urllib.request # urllib模块介绍：一共是四块， urllib.request - 打开和读取 URL。 urllib.err 阅读全文

posted @ 2021-09-11 22:40 技术改变命运Andy 阅读(70) 评论(0) 推荐(0)

scrapy框架使用-下载图片，使用urllib，使用requests，使用imagepipeline，

摘要： ### 这是使用的urllib， #### 使用requests下载图片 import requests # 这是一个图片的url url = 'http://yun.itheima.com/Upload/Images/20170614/594106ee6ace5.jpg' response = r 阅读全文

posted @ 2021-09-11 22:39 技术改变命运Andy 阅读(155) 评论(0) 推荐(0)

4-05python语法基础-内置模块-json模块

摘要： ### # 序列化是什么？现在的序列化都是转向一个字符串数据类型，我们说的序列就是字符串， # 为什么要千方百计的转换成为字符串呢？是为了存储和传递如果一个字典{"k":"v"}为什么要转成字符串 1，我往文件或者数据库里面写内容的时候是不能写入字典的，可以写入字符串， 2，还有在网络上传输阅读全文

posted @ 2021-09-11 05:05 技术改变命运Andy 阅读(123) 评论(0) 推荐(0)

scrapy-shell的使用

摘要： #### 进入虚拟环境，里面安装了scrapy，进入命令行，输入命令，scrapy shell 'https://scrapy.org' --nolog，执行后，会自动将指定 url 的网页下载下来，注意一点：不要在你的爬虫项目文件夹下面执行这个命令，会报错的，会弹出交互页面，然后你就可以使阅读全文

posted @ 2021-09-11 03:12 技术改变命运Andy 阅读(137) 评论(0) 推荐(0)

scrapy框架-异步的体现，关于scrapy框架自定义的问题，关于scrapy框架扩展的问题，

摘要： #### 在爬虫里面，使用yield，就是协程异步的体现，所以我干保证，面试的时候一定会涉及到线程，涉及到协程，的使用，这个必须要深刻的理解， #### 必须要搞定这个线程协程，然后还有就是这个框架，然后你才能自定义，才能扩展这个框架， ##### 阅读全文

posted @ 2021-09-11 02:40 技术改变命运Andy 阅读(79) 评论(0) 推荐(0)