林深时见鹿

2017年3月5日

摘要：我们一起尝试一下爬取内涵段子网站： http://www.neihan8.com/article/list_5_1.html 第一步：获取数据这里我们统一定义一个类，将url请求作为一个成员方法处理。我们创建一个文件，叫duanzi_spider.py 然后定义一个Spider类，并且添加一个加阅读全文

posted @ 2017-03-05 23:04 林深时见鹿阅读(706) 评论(0) 推荐(0) 编辑

爬虫之正则表达式的应用爬取

摘要： Python 的 re 模块在 Python 中，我们可以使用内置的 re 模块来使用正则表达式。有一点需要特别注意的是，正则表达式使用对特殊字符进行转义，所以如果我们要使用原始字符串，只需加一个 r 前缀，示例： re 模块的一般使用步骤如下：使用 compile() 函数将正则表达式的字阅读全文

posted @ 2017-03-05 22:55 林深时见鹿阅读(1921) 评论(0) 推荐(0) 编辑

爬虫之Requests: 让 HTTP 服务人类

摘要： Requests: 让 HTTP 服务人类虽然Python的标准库中 urllib2 模块已经包含了平常我们使用的大多数功能，但是它的 API 使用起来让人感觉不太好，而 Requests 自称 “HTTP for Humans”，说明使用更简洁方便。 Requests 唯一的一个非转基因的 Py 阅读全文

posted @ 2017-03-05 22:47 林深时见鹿阅读(1501) 评论(0) 推荐(0) 编辑

爬虫之Handler处理器和自定义Opener

摘要： Handler处理器和自定义Opener opener是 urllib2.OpenerDirector 的实例，我们之前一直都在使用的urlopen，它是一个特殊的opener（也就是模块帮我们构建好的）。但是基本的urlopen()方法不支持代理、cookie等其他的HTTP/HTTPS高级阅读全文

posted @ 2017-03-05 22:36 林深时见鹿阅读(4218) 评论(0) 推荐(0) 编辑

爬虫之urllib2库的基本使用

摘要： urllib2库的基本使用所谓网页抓取，就是把URL地址中指定的网络资源从网络流中读取出来，保存到本地。在Python中有很多库可以用来抓取网页，我们先学习urllib2。 urllib2 是 Python2.7 自带的模块(不需要下载，导入即可使用) urllib2 官方文档：https:// 阅读全文

posted @ 2017-03-05 22:31 林深时见鹿阅读(784) 评论(0) 推荐(0) 编辑

爬虫之Fiddler抓取HTTPS设置

摘要： Fiddler抓取HTTPS设置启动Fiddler，打开菜单栏中的 Tools > Telerik Fiddler Options，打开“Fiddler Options”对话框。对Fiddler进行设置：打开工具栏->Tools->Fiddler Options->HTTPS，选中Captu 阅读全文

posted @ 2017-03-05 22:28 林深时见鹿阅读(3252) 评论(0) 推荐(0) 编辑

2017年2月28日

mysql索引的建立和使用

摘要：转自【http://www.cnblogs.com/mywebname/articles/555696.html】一、索引的概念索引就是加快检索表中数据的方法。数据库的索引类似于书籍的索引。在书籍中，索引允许用户不必翻阅完整个书就能迅速地找到所需要的信息。在数据库中，索引也允许数据库程序迅速地找阅读全文

posted @ 2017-02-28 00:01 林深时见鹿阅读(1321) 评论(0) 推荐(0) 编辑

2017年2月24日

HTML请求与相应

摘要： HTTP的请求与响应 HTTP通信由两部分组成：客户端请求消息与服务器响应消息浏览器发送HTTP请求的过程：当用户在浏览器的地址栏中输入一个URL并按回车键之后，浏览器会向HTTP服务器发送HTTP请求。HTTP请求主要分为“Get”和“Post”两种方法。当我们在浏览器输入URL ht 阅读全文

posted @ 2017-02-24 22:32 林深时见鹿阅读(4616) 评论(0) 推荐(0) 编辑

2017年2月23日

解析TCP三次握手

摘要：转自：http://www.jellythink.com/archives/705 https://www.sohu.com/a/243234826_653604 三次握手又是什么？ TCP是面向连接的，无论哪一方向另一方发送数据之前，都必须先在双方之间建立一条连接。在TCP/IP协议中，TCP协议阅读全文

posted @ 2017-02-23 23:33 林深时见鹿阅读(240) 评论(0) 推荐(0) 编辑

HTTP协议详解

摘要：转自：http://www.cnblogs.com/ranyonsue/p/5984001.html HTTP简介 HTTP协议是Hyper Text Transfer Protocol（超文本传输协议）的缩写,是用于从万维网（WWW:World Wide Web ）服务器传输超文本到本地浏览器的传阅读全文

posted @ 2017-02-23 23:20 林深时见鹿阅读(240) 评论(0) 推荐(0) 编辑

公告