摘要: 一 介绍 selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题 selenium本质是通过驱动浏览器,完全模拟浏览器的操作,比如跳转、输入、点击、下拉等,来拿到网页渲染之后的结果,可支持多种浏览器 from selenium 阅读全文
posted @ 2019-11-26 16:14 凯帅 阅读(713) 评论(0) 推荐(0) 编辑
摘要: 一 介绍 Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找, 修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.你可能在寻找 Beautiful Soup3 的文档,Beautif 阅读全文
posted @ 2019-11-26 16:07 凯帅 阅读(257) 评论(0) 推荐(0) 编辑
摘要: 一、介绍 # 介绍:使用requests可以模拟浏览器使用 # 安装:pip3 install requests # 各种请求的方式:常用requests.get()和requests.post() 二、基于GET请求 1.基本请求 import requests # res=requests.ge 阅读全文
posted @ 2019-11-26 15:28 凯帅 阅读(223) 评论(0) 推荐(0) 编辑
摘要: 01-01爬虫基本原理 一 爬虫是什么 #1、什么是互联网? 互联网是由网络设备(网线,路由器,交换机,防火墙等等)和一台台计算机连接而成,像一张网一样。 #2、互联网建立的目的? 互联网的核心价值在于数据的共享/传递:数据是存放于一台台计算机上的,而将计算机互联到一起的目的就是为了能够方便彼此之间 阅读全文
posted @ 2019-11-26 15:00 凯帅 阅读(163) 评论(0) 推荐(0) 编辑