摘要: #今天继昨天之后学习selenium。见天学习的内容就是利用驱动浏览器访问一些网站,并复制网站上的一些信息 #利用驱动浏览器访问京东主页 ,并搜索相应的商品,并将相应的信息打印到文本中 阅读全文
posted @ 2019-06-28 21:23 羊王 阅读(143) 评论(0) 推荐(0) 编辑
摘要: 一 Selenium请求库1.什么是selenium?selenium是一个自动测试工具,它可以帮我通过代码去实现驱动浏览器自动执行相应的操作。所以我们也可以用它来做爬虫。 2.为什么要使用selenium?主要使用selenium的目的是为了跳过登录验证。 3.安装与使用- 下载驱动器:http: 阅读全文
posted @ 2019-06-27 21:28 羊王 阅读(126) 评论(0) 推荐(0) 编辑
摘要: 一、爬虫原理 1.什么是互联网? 指的是由一堆网络,把一台台计算机互联到一起称之为互联网。 2.互联网建立的目的? 为了数据的传递以及数据的共享。 3.上网的全过程: 普通用户:打开浏览器->往目标网站发送请求->获取响应数据->渲染到浏览器中 爬虫程序:模拟浏览器->往目标网站发送请求->获取响应数据->提取有价值数据->持久化到数据中 ... 阅读全文
posted @ 2019-06-26 21:34 羊王 阅读(141) 评论(0) 推荐(0) 编辑
摘要: 今日内容: 1.常用数据类型及内置方法 2.文件处理 3.函数 一 数据类型: 列表类型: 定义: 在[]内,可以存放多个任意类型的值,并以逗号隔开。 一般用于存放学生的爱好,课堂的周期等等... 优先掌握的操作: 1、按索引存取值(正向存取+反向存取):即可存也可以取 2、切片(顾头不顾尾,步长) 阅读全文
posted @ 2019-06-25 21:38 羊王 阅读(166) 评论(0) 推荐(0) 编辑
摘要: 今天是学习python的第一天,在今天的学习中,总共学习了包括: 一、 python的安装与使用 1.安装python解释器 2.安装pycharm编辑器 3.编写python代码,并输出打印hello world! 二、 变量 可变化的量。 变量值: 是真实存放在内存中的一块内存地址。 变量名: 阅读全文
posted @ 2019-06-24 20:11 羊王 阅读(178) 评论(0) 推荐(0) 编辑