GroundControl_852

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2020年4月11日

摘要: 爬取思路:- 1.分析网站是否ajax解析数据,清除页面刷新网站,看XHR有没有对应的网站,发现为空,表明数据不是由ajax数据解析来的,我们可以直接由网站url来抓取数据,即 url = "https://www.pearvideo.com/category_4" 顺便获取headers head 阅读全文
posted @ 2020-04-11 10:46 GroundControl_852 阅读(174) 评论(0) 推荐(0) 编辑

摘要: 1.命名空间和作用域命名空间 有三种 内置命名空间 —— python解释器 就是python解释器一启动就可以使用的名字存储在内置命名空间中.内置的名字在启动解释器的时候被加载进内存里 全局命名空间 —— 我们写的代码但不是函数中的代码 是在程序从上到下被执行的过程中依次加载进内存的.放置了我们设 阅读全文
posted @ 2020-04-11 10:34 GroundControl_852 阅读(136) 评论(0) 推荐(0) 编辑