摘要: '''''' from selenium import webdriver # web驱动 from selenium.webdriver.common.keys import Keys # 键盘按键操作 import time import time driver = webdriver.Chrome() try: # 隐式等待: 需要在get之前调用 # 等待任意... 阅读全文
posted @ 2019-07-02 17:23 阿泽zzz 阅读(209) 评论(0) 推荐(0) 编辑
摘要: from selenium import webdriver # web驱动 from selenium.webdriver.common.by import By # 按照什么方式查找,By.ID,By.CSS_SELECTOR from selenium.webdriver.common.keys import Keys # 键盘按键操作 from selenium.webdriver... 阅读全文
posted @ 2019-07-02 17:22 阿泽zzz 阅读(126) 评论(0) 推荐(0) 编辑
摘要: ''' POST请求自动登录github: 请求URL: http://github.com/session 请求方式: post 请求头: cookie user-agent 请求体: commit:Sign in utf8:✓... 阅读全文
posted @ 2019-07-02 17:21 阿泽zzz 阅读(418) 评论(0) 推荐(0) 编辑
摘要: # 请求url: # https://movie.douban.com/top250 # 请求方式: # GET # 请求头: # User-Agent # cookies ''' 爬取豆瓣电影信息: 电影名称 电影url 电影导演 电影主演 电影年份 电影类型 电影评分 电影简介 ... 阅读全文
posted @ 2019-07-02 17:20 阿泽zzz 阅读(483) 评论(0) 推荐(0) 编辑
摘要: 今日内容:爬虫课程:一爬虫基本原理二reques ts请求库 一爬虫基本原理1、什么是爬虫?爬虫就是爬取数据。 2、什么是互联网?由一堆网络设备,把一台台的计算机互联到一起称之为互联网。 3、互联网建立的目的数据的传递与数据的共享。 4、什么是数据?例如: 电商平台的商品信息(淘宝、京东、亚马逊)链 阅读全文
posted @ 2019-07-02 17:19 阿泽zzz 阅读(108) 评论(0) 推荐(0) 编辑