上一页 1 ··· 5 6 7 8 9 10 下一页
摘要: 我们一起尝试一下爬取内涵段子网站: http://www.neihan8.com/article/list_5_1.html 第一步:获取数据 这里我们统一定义一个类,将url请求作为一个成员方法处理。 我们创建一个文件,叫duanzi_spider.py 然后定义一个Spider类,并且添加一个加 阅读全文
posted @ 2017-03-05 23:04 林深时见鹿 阅读(706) 评论(0) 推荐(0) 编辑
摘要: Python 的 re 模块 在 Python 中,我们可以使用内置的 re 模块来使用正则表达式。 有一点需要特别注意的是,正则表达式使用 对特殊字符进行转义,所以如果我们要使用原始字符串,只需加一个 r 前缀,示例: re 模块的一般使用步骤如下: 使用 compile() 函数将正则表达式的字 阅读全文
posted @ 2017-03-05 22:55 林深时见鹿 阅读(1921) 评论(0) 推荐(0) 编辑
摘要: Requests: 让 HTTP 服务人类 虽然Python的标准库中 urllib2 模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests 自称 “HTTP for Humans”,说明使用更简洁方便。 Requests 唯一的一个非转基因的 Py 阅读全文
posted @ 2017-03-05 22:47 林深时见鹿 阅读(1501) 评论(0) 推荐(0) 编辑
摘要: Handler处理器 和 自定义Opener opener是 urllib2.OpenerDirector 的实例,我们之前一直都在使用的urlopen,它是一个特殊的opener(也就是模块帮我们构建好的)。 但是基本的urlopen()方法不支持代理、cookie等其他的HTTP/HTTPS高级 阅读全文
posted @ 2017-03-05 22:36 林深时见鹿 阅读(4218) 评论(0) 推荐(0) 编辑
摘要: urllib2库的基本使用 所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。 在Python中有很多库可以用来抓取网页,我们先学习urllib2。 urllib2 是 Python2.7 自带的模块(不需要下载,导入即可使用) urllib2 官方文档:https:// 阅读全文
posted @ 2017-03-05 22:31 林深时见鹿 阅读(784) 评论(0) 推荐(0) 编辑
摘要: Fiddler抓取HTTPS设置 启动Fiddler,打开菜单栏中的 Tools > Telerik Fiddler Options,打开“Fiddler Options”对话框。 对Fiddler进行设置: 打开工具栏->Tools->Fiddler Options->HTTPS, 选中Captu 阅读全文
posted @ 2017-03-05 22:28 林深时见鹿 阅读(3252) 评论(0) 推荐(0) 编辑
摘要: 转自【http://www.cnblogs.com/mywebname/articles/555696.html】 一、索引的概念 索引就是加快检索表中数据的方法。数据库的索引类似于书籍的索引。在书籍中,索引允许用户不必翻阅完整个书就能迅速地找到所需要的信息。在数据库中,索引也允许数据库程序迅速地找 阅读全文
posted @ 2017-02-28 00:01 林深时见鹿 阅读(1321) 评论(0) 推荐(0) 编辑
摘要: HTTP的请求与响应 HTTP通信由两部分组成: 客户端请求消息 与 服务器响应消息 浏览器发送HTTP请求的过程: 当用户在浏览器的地址栏中输入一个URL并按回车键之后,浏览器会向HTTP服务器发送HTTP请求。HTTP请求主要分为“Get”和“Post”两种方法。 当我们在浏览器输入URL ht 阅读全文
posted @ 2017-02-24 22:32 林深时见鹿 阅读(4616) 评论(0) 推荐(0) 编辑
摘要: 转自:http://www.jellythink.com/archives/705 https://www.sohu.com/a/243234826_653604 三次握手又是什么? TCP是面向连接的,无论哪一方向另一方发送数据之前,都必须先在双方之间建立一条连接。在TCP/IP协议中,TCP协议 阅读全文
posted @ 2017-02-23 23:33 林深时见鹿 阅读(240) 评论(0) 推荐(0) 编辑
摘要: 转自:http://www.cnblogs.com/ranyonsue/p/5984001.html HTTP简介 HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW:World Wide Web )服务器传输超文本到本地浏览器的传 阅读全文
posted @ 2017-02-23 23:20 林深时见鹿 阅读(240) 评论(0) 推荐(0) 编辑
上一页 1 ··· 5 6 7 8 9 10 下一页