07 2019 档案
摘要:'''爬取豌豆荚APP数据 url:https://www.wandoujia.com/category/6001 data: 名称、详情页、下载人数、APP大小 app_name detail_url download_num app_size <a href="" title="" class=
阅读全文
摘要:今日内容: 一 Selenium剩余部分 二 BeautifulSoup4一 Selenium剩余部分1.元素交互操作: -点击、清除 click clear -ActionChains 是一个动作链对象,需要把driver驱动传给它。 动作链对象可以操作一系列设定好的动作行为 -iframe的切换
阅读全文
摘要:昨日回顾: 一、爬虫基本原理 -爬虫全过程 1.发送请求 2.接收响应数据 3.解析并提取有价值的数据 4.保存数据 二、Resquests请求库 -get url header cookies -post url header cookies data 三、爬取校花网 1.通过主页解析提取详情页
阅读全文
摘要:一、爬虫的基本原理 1.什么是爬虫 爬虫就是爬取数据 2、什么是互联网 由一堆网络设备,把一台台计算机互联到一起称之为互联网 3、互联网建立的目的 数据的传递与数据共享 4、什么是数据 例如: 电商平台的商品信息 12306,票务信息 12306,票务信息 5、什么是上网 普通用户: 打开浏览器 >
阅读全文