摘要: 豌豆荚游戏信息搜取 阅读全文
posted @ 2019-07-04 09:18 非道版 阅读(106) 评论(0) 推荐(0) 编辑
摘要: find:找第一个 find_ all:找所有 标签查找与属性查找: name 属性匹配 name 标签名 attrs 属性查找匹配 text 文本匹配 标签: -字符串过滤器 字符串全局匹配 -正则过滤器 re模块匹配 -列表过滤器 列表内的数据匹配 -bool过滤器 True匹配 -方法过滤器 阅读全文
posted @ 2019-07-03 20:17 非道版 阅读(94) 评论(0) 推荐(0) 编辑
摘要: 今日内容:一 Selenium剩余部分 二 BeautifulSoup4一 Selenium剩余部分1.元素交互操作: ——点击、清除 ——Actions Chains ——frame的切换 ——执行js代码 from selenium import webdriver from selenium. 阅读全文
posted @ 2019-07-03 11:25 非道版 阅读(133) 评论(0) 推荐(0) 编辑
摘要: 一requests 请求库爬取豆瓣电影信息一请求urlhttps: / /movie . douban. com/ top250一请求方式GET请求头user- -agentcookies import requests import re def get_page(url): response=r 阅读全文
posted @ 2019-07-02 11:36 非道版 阅读(105) 评论(0) 推荐(0) 编辑
摘要: import requests import re login_url='https://github.com/login' login_header={ 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 ... 阅读全文
posted @ 2019-07-01 20:32 非道版 阅读(103) 评论(0) 推荐(0) 编辑
摘要: 今日内容: 爬虫课程: 一爬虫基本原理 二requests请求库 一爬虫基本原理 1、什么是爬虫? 爬虫就是爬取数据。 2、什么是互联网? 由一堆网络设备,把一台台的计算机互联到一起称之为互联网。 3、互联网建立的目的 数据的传递与数据的共享。 4、什么是数据? 例如: 电商平台的商品信息(淘宝、京 阅读全文
posted @ 2019-07-01 14:44 非道版 阅读(139) 评论(0) 推荐(0) 编辑