摘要: 从github或者其他地方下载zip tar.zip tar.bz2 的压缩文件 解压缩 进入目录 或者git clone python setup.py install 具体位置 视操作系统和你当初安装Python环境时候设置的路径 而定 Lib/Site-packages 直接找到库文件的位置 阅读全文
posted @ 2018-07-05 18:47 duxiao123 阅读(142) 评论(0) 推荐(0) 编辑
摘要: urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None) Open the URL url, which can be either a 阅读全文
posted @ 2018-07-05 09:18 duxiao123 阅读(137) 评论(0) 推荐(0) 编辑
摘要: 首先说 正则表达式是什么? 正则表达式,又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。在很多文本编 阅读全文
posted @ 2018-07-05 08:56 duxiao123 阅读(171) 评论(0) 推荐(0) 编辑
摘要: python 3中最重要的新特性可能就是将文本(text)和二进制数据做了更清晰的区分。文本总是用unicode进行编码,以str类型表示;而二进制数据以bytes类型表示。 在python3中,不能以任何隐式方式将str和bytes类型二者混合使用。不可以将str和bytes类型进行拼接,不能在s 阅读全文
posted @ 2018-07-05 08:07 duxiao123 阅读(310) 评论(0) 推荐(0) 编辑
摘要: 我们首先了解一下 Urllib 库,它是 Python 内置的 HTTP 请求库,也就是说我们不需要额外安装即可使用,它包含四个模块: 第一个模块 request,它是最基本的 HTTP 请求模块,我们可以用它来模拟发送一请求,就像在浏览器里输入网址然后敲击回车一样,只需要给库方法传入 URL 还有 阅读全文
posted @ 2018-07-04 18:22 duxiao123 阅读(184) 评论(0) 推荐(0) 编辑
摘要: HTTP请求的Python实现帮助大家了解Python中实现HTTP请求的各种方式 具备编写HTTP网络程序的能力 通用网络爬虫 聚焦网络爬虫 增量式网络爬虫 深层网络爬虫 实际的网络爬虫系统通常是几种爬虫技术相结合实现的 0 搜索引擎search Engine 通用的网络爬虫 存在一定的 局限性 阅读全文
posted @ 2018-07-04 17:40 duxiao123 阅读(263) 评论(0) 推荐(0) 编辑
摘要: JSON是JavaScript对象表示法 JavaScript Object Notation 用于存储和交换文本信息 JSON比XML更小 更快 更易解析 因此 JSON 在网络传输中 尤其是Web前端中运用非常广泛 JSON使用JavaScript语法来描述数据对象 JSON仍然独立于原因和平台 阅读全文
posted @ 2018-07-04 17:10 duxiao123 阅读(70) 评论(0) 推荐(0) 编辑
摘要: 一门在XML文档中查找信息的语言,通过属性和元素进行导航 可用于HTML文档 大部分浏览器也支持通过XPath来查询节点 在Python爬虫开发中经常使用XPath查询提取网页中的 信息 因此XPath非常重要 XPath既然 叫Path 以路径表达式的形式来指定元素 节点 语法 轴 和运算符 XM 阅读全文
posted @ 2018-07-04 17:02 duxiao123 阅读(83) 评论(0) 推荐(0) 编辑
摘要: Web技术领域最具权威和影响力的国际中立性技术标准机构 万维网联盟 W3C 标准不是某一个标准 而是一系列 标准的 集合 网页组成: 结构structure 表现presentation 行为behavior HTML不是编程语言 标记语言 web浏览器的作用读取HTML文档 你我皆凡人 生在人世间 阅读全文
posted @ 2018-07-04 16:37 duxiao123 阅读(131) 评论(0) 推荐(0) 编辑
摘要: IO在计算机中指的是Input/Output也就是输入输出 凡是用到数据交换的地方 都会涉及IO编程 例如 磁盘 网络的数据传输 在IO编程中 Stream流是一种重要的概念 分为 输入流 和输出流 ,可以把 流理解为一个水管 数据相当于水管中的 水 但是只能单向流动 所以数据传输过程中 需要架设两 阅读全文
posted @ 2018-07-04 15:59 duxiao123 阅读(1099) 评论(0) 推荐(0) 编辑