摘要: 1.下载谷歌浏览器 2.在谷歌浏览器内打开百度 3.打开百度的开发者工具:ctrl+shift+I 4. 5.关注内容解释: 6. requests模块的使用 7.网上爬取视频: 说明:获取视频源的办法:用谷歌浏览器打开梨视频,然后打开开发者模式,然后点开element ,然后选择相应的视频,然后点 阅读全文
posted @ 2019-06-13 16:23 evan0925 阅读(142) 评论(0) 推荐(0) 编辑
摘要: 二 爬虫的基本流程 爬虫的基本流程其实就是模拟浏览器往目标站点发送请求,那浏览器发送的是http协议数据格式的请求,http协议的底层其实就是TCP协议数据格式。其实浏览器是一个套接字客户端,访问的目标站点是一个套接字服务端。那套接字客户端要与套接字服务端建立链接,得先拿到 ”客户端的ip和端口“ 阅读全文
posted @ 2019-06-13 15:09 evan0925 阅读(144) 评论(0) 推荐(0) 编辑
摘要: 1、json模块 json 模块使用图解: 如上,会报错,因为user_info为字典类型,而open要求写入的是字符串。 修改如下: 反序列化如下: dump__自带写功能,自动触发.white()功能 如上,修改: load 也自带读功能,简化代码如下: 2.time 模块 3.os 模块 4. 阅读全文
posted @ 2019-06-13 11:33 evan0925 阅读(177) 评论(0) 推荐(0) 编辑
摘要: 1、import 模块名 》 新建文件夹如B, 该文件夹可以被看做是模块 故:可以 import B 但是 2、from B import a #用于导入 a.py文件 他们之间的关系 阅读全文
posted @ 2019-06-13 11:09 evan0925 阅读(110) 评论(0) 推荐(0) 编辑
摘要: 一 什么是名称空间? 二名称空间的加载顺序 运行调用过程如上图 阅读全文
posted @ 2019-06-13 10:38 evan0925 阅读(119) 评论(0) 推荐(0) 编辑
摘要: 一 形参与实参 二 具体应用 阅读全文
posted @ 2019-06-13 09:10 evan0925 阅读(114) 评论(0) 推荐(0) 编辑
摘要: 如上程序,利用该特性,优雅的取代多分支的if,作用:减少了数据的冗余, 说明: 函数是第一类对象,即函数可以当作数据传递 函数嵌套: 嵌套定义: 在函数内,定义函数 嵌套定义的函数调用: 1、通过函数内部的返回值调用 2.嵌套定义的同时,将调用写在定义的内部 https://www.cnblogs. 阅读全文
posted @ 2019-06-13 09:09 evan0925 阅读(197) 评论(0) 推荐(0) 编辑
摘要: 1、import os #用于和操作系统交互 2、解压赋值 username,password=res.split(":") 等价于: 函数定义的三种方式 1、无参函数 不需要接收外部传入的参数 def foo(): print(“from foo”) 2、有参函数 需要接收外部传入的参数 def 阅读全文
posted @ 2019-06-13 08:26 evan0925 阅读(128) 评论(0) 推荐(0) 编辑
摘要: 今日内容: 1.函数剩余部分 2.内置模块 3.模块与包 4.爬虫基本原理 5.requersts模块 阅读全文
posted @ 2019-06-13 08:17 evan0925 阅读(88) 评论(0) 推荐(0) 编辑