07 2019 档案

爬取豌豆荚

摘要：'''爬取豌豆荚APP数据 url：https://www.wandoujia.com/category/6001 data：名称、详情页、下载人数、APP大小 app_name detail_url download_num app_size <a href="" title="" class= 阅读全文

posted @ 2019-07-03 22:00 星峰之耀阅读(279) 评论(0) 推荐(0) 编辑

day03 bs4解析库

摘要：今日内容：一 Selenium剩余部分二 BeautifulSoup4一 Selenium剩余部分1.元素交互操作： -点击、清除 click clear -ActionChains 是一个动作链对象，需要把driver驱动传给它。动作链对象可以操作一系列设定好的动作行为 -iframe的切换阅读全文

posted @ 2019-07-03 17:24 星峰之耀阅读(177) 评论(0) 推荐(0) 编辑

day02—selenium库

摘要：昨日回顾：一、爬虫基本原理 -爬虫全过程 1.发送请求 2.接收响应数据 3.解析并提取有价值的数据 4.保存数据二、Resquests请求库 -get url header cookies -post url header cookies data 三、爬取校花网 1.通过主页解析提取详情页阅读全文

posted @ 2019-07-02 16:09 星峰之耀阅读(124) 评论(0) 推荐(0) 编辑

day01爬虫三部曲

摘要：一、爬虫的基本原理 1.什么是爬虫爬虫就是爬取数据 2、什么是互联网由一堆网络设备，把一台台计算机互联到一起称之为互联网 3、互联网建立的目的数据的传递与数据共享 4、什么是数据例如：电商平台的商品信息 12306，票务信息 12306，票务信息 5、什么是上网普通用户：打开浏览器 > 阅读全文

posted @ 2019-07-01 14:44 星峰之耀阅读(181) 评论(0) 推荐(0) 编辑

公告

昵称：星峰之耀
园龄： 5年8个月
粉丝： 0
关注： 10

+加关注

2025年3月

日

一

二

三

四

五

六

KH往事

07 2019 档案

公告

搜索

常用链接

随笔档案

阅读排行榜