摘要: Python语言支持以下类型的运算符: 算术运算符 比较(关系)运算符 赋值运算符 逻辑运算符 位运算符 成员运算符 身份运算符 运算符优先级 1、算术运算符 假设变量a = 10,变量b = 21: 2、比较(关系)运算符 假设变量a = 10,变量b = 21: 3、赋值运算符 假设变量a = 阅读全文
posted @ 2018-08-16 01:46 Nice1949 阅读(141) 评论(0) 推荐(0) 编辑
摘要: 1.Python语言特点 2.Python应用场景 3、注释 4、中文编码问题 5、多行语句 Python 通常是一行写完一条语句,但如果语句很长,可以使用反斜杠()来实现多行语句,示例: 在 [], {}, 或 () 中的多行语句,不需要使用反斜杠(),示例: 6、标识符 标识符: 由字母、数字、 阅读全文
posted @ 2018-08-16 00:42 Nice1949 阅读(179) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2018-08-15 23:35 Nice1949 阅读(32) 评论(0) 推荐(0) 编辑
摘要: Scrapy 框架介绍 Scrapy是用纯Python实现一个为了爬取网站数据、提取结构性数据而编写的应用框架。 Srapy框架,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片,非常方便。 Scrapy 使用了Twisted异步网络框架来处理网络通讯,可加快下载速度 阅读全文
posted @ 2018-08-13 00:33 Nice1949 阅读(179) 评论(0) 推荐(0) 编辑
摘要: Scrapy Shell Scrapy终端是一个交互终端,我们可以在未启动spider的情况下尝试及调试代码,也可以用来测试XPath或CSS表达式,查看他们的工作方式,方便我们爬取的网页中提取的数据。 启动Scrapy Shell 进入项目的根目录,执行下列命令来启动shell: Scrapy S 阅读全文
posted @ 2018-08-12 12:47 Nice1949 阅读(321) 评论(0) 推荐(0) 编辑
摘要: Scrapy的安装介绍 Scrapy框架官方网址:http://doc.scrapy.org/en/latest Scrapy中文维护站点:http://scrapy-chs.readthedocs.io/zh_CN/latest/index.html Windows 安装方式 Python 2 / 阅读全文
posted @ 2018-08-12 03:33 Nice1949 阅读(307) 评论(0) 推荐(0) 编辑
摘要: ORC库概述 在读取和处理图像、图像相关的机器学习以及创建图像等任务中,Python 一直都是非常出色的语言。虽然有很多库可以进行图像处理,但在这里我们只重点介绍:Tesseract 1.Tesseract Tesseract 是一个 OCR 库,目前由 Google 赞助(Google 也是一家以 阅读全文
posted @ 2018-08-12 02:37 Nice1949 阅读(893) 评论(0) 推荐(0) 编辑
摘要: 案例一:网站模拟登录 案例二:动态页面模拟点击 案例三:执行 JavaScript 语句 1.隐藏百度图片 2.模拟滚动条滚动到底部 阅读全文
posted @ 2018-08-12 01:48 Nice1949 阅读(273) 评论(0) 推荐(0) 编辑
摘要: JavaScript JavaScript 是网络上最常用也是支持者最多的客户端脚本语言。它可以收集用户的跟踪数据,不需要重载页面直接提交表单,在页面嵌入多媒体文件,甚至运行网页游戏。 我们可以在网页源代码的<scripy>标签里看到,比如: jQuery jQuery是一个十分常见的库,70% 最 阅读全文
posted @ 2018-08-12 01:31 Nice1949 阅读(425) 评论(0) 推荐(0) 编辑
摘要: 糗事百科爬虫实例: 地址:http://www.qiushibaike.com/8hr/page/1 需求: 使用requests获取页面信息,用XPath / re 做数据提取 获取每个帖子里的用户头像链接、用户姓名、段子内容、点赞次数和评论次数 保存到 json 文件内 Queue(队列对象) 阅读全文
posted @ 2018-08-11 22:07 Nice1949 阅读(569) 评论(0) 推荐(0) 编辑