摘要: 爬取豌豆荚多页app数据 阅读全文
posted @ 2019-07-04 09:28 吼嘿嘿吼 阅读(85) 评论(0) 推荐(0) 编辑
摘要: 方法一:requests+bs4 方法二:selenium 阅读全文
posted @ 2019-07-03 21:04 吼嘿嘿吼 阅读(299) 评论(0) 推荐(0) 编辑
摘要: 上午 selenium元素交互操作 ——点击、清除 ——Actions Chains 动作链对象,需要把driver驱动传给它。 动作链对象可以操作一系列设定好的动作行为 ——frame的切换 1.方式一:起始目标向重点目标 瞬间移动 2.方式二:缓慢移动 ——执行js代码 前进后退 爬取京东商品信 阅读全文
posted @ 2019-07-03 11:27 吼嘿嘿吼 阅读(122) 评论(0) 推荐(0) 编辑
摘要: 爬取豆瓣网站电影top250 Selenium请求库 1.什么是Selenium 起初是一个自动化测试工具,原理是驱动浏览器执行一些已定好的操作。 爬虫本质上就是模拟浏览器,所以可以使用它来做爬虫 2.为什么要使用Selenium 优点: ——执行js代码 ——不需要分析复杂的通信流程 ——对浏览器 阅读全文
posted @ 2019-07-02 12:43 吼嘿嘿吼 阅读(229) 评论(0) 推荐(0) 编辑
摘要: 上午: 一、爬虫基本原理 1. 什么是爬虫? 爬取数据 2. 什么是互联网? 由一堆网络设备,把一台台的计算机互联到一起 3. 互联网建立的目的 数据的传递与分享 4. 什么是数据? 例如:电商平台的商品信息 链家、自如的房源信息 股票证券投资信息(雪球网,东方财富) 12306的票务信息 5. 什 阅读全文
posted @ 2019-07-01 14:53 吼嘿嘿吼 阅读(85) 评论(0) 推荐(0) 编辑