摘要: 1、建立连接协议(三次握手) (1)客户端发送一个带SYN标志的TCP报文到服务器。这是三次握手过程中的报文1。 (2)服务器端回应客户端的,这是三次握手中的第2个报文,这个报文同时带ACK标志和SYN标志。因此它表示对刚才客户端SYN报文的回应;同时又标识SYN给客户端,询问客户端是否准备好进行数 阅读全文
posted @ 2020-10-11 21:46 曾庆林 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 终于要开始写爬虫代码了 我们首先了解一下 Urllib 库,它是 Python 内置的 HTTP 请求库,也就是说我们不需要额外安装即可使用,它包含四个模块: 第一个模块 request,它是最基本的 HTTP 请求模块,我们可以用它来模拟发送一请求,就像在浏览器里输入网址然后敲击回车一样,只需要给 阅读全文
posted @ 2020-10-11 10:12 曾庆林 阅读(223) 评论(0) 推荐(0) 编辑
摘要: HTTP协议介绍 设计HTTP(HyperText Transfer Protocol)是为了提供一种发布和接收HTML(HyperText Markup Language)页面的方法。 Http组成 由两部分组成:请求与响应 客户端请求消息 客户端发送一个HTTP请求到服务器的请求消息包括以下格式 阅读全文
posted @ 2020-10-11 09:57 曾庆林 阅读(231) 评论(0) 推荐(0) 编辑
摘要: Fiddler不但能截获各种浏览器发出的HTTP请求, 也可以截获各种智能手机发出的HTTP/HTTPS请求。 Fiddler能捕获IOS设备发出的请求,比如IPhone, IPad, MacBook. 等等苹果的设备。 同理,也可以截获Andriod,Windows Phone的等设备发出的HTT 阅读全文
posted @ 2020-10-11 09:49 曾庆林 阅读(219) 评论(0) 推荐(0) 编辑
摘要: 爬虫是 模拟用户在浏览器或者某个应用上的操作,把操作的过程、实现自动化的程序 当我们在浏览器中输入一个url后回车,后台会发生什么?比如说你输入http://www.sina.com.cn/ 简单来说这段过程发生了以下四个步骤: 查找域名对应的IP地址。 向IP对应的服务器发送请求。 服务器响应请求 阅读全文
posted @ 2020-10-11 09:46 曾庆林 阅读(193) 评论(0) 推荐(0) 编辑
摘要: 学习目的 了解爬虫,爬虫起源; 爬虫是什么 专业术语:网络爬虫(又被称为网页蜘蛛,网络机器人) 网络爬虫,是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。 爬虫起源(产生背景) 随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战; 搜索引擎有Yah 阅读全文
posted @ 2020-10-11 09:43 曾庆林 阅读(244) 评论(0) 推荐(0) 编辑
摘要: 《python小白入门系列教程》 有对象吗? 没有就new 一个 今天我们要用python new 一个对象 面向过程VS面向对象 1)面向过程 核心是过程(流水线式思维),过程即解决问题的步骤,面向过程的设计就好比精心设计好一条流水线,考虑周全什么时候处理什么东西。 **优点是:**极大的降低了写 阅读全文
posted @ 2020-09-27 22:10 曾庆林 阅读(296) 评论(0) 推荐(0) 编辑
摘要: 《python小白入门系列教程》 专栏 • 第09篇 有些时候你的程序会与用户产生交互。举个例子,你会希望获取用户的输入内容,并向用户 打印出一些返回的结果。我们可以分别通过 input() 函数与print函数来实现这一需求。 对于输入,我们还可以使用 str (String,字符串)类的各种方法 阅读全文
posted @ 2020-09-27 22:07 曾庆林 阅读(380) 评论(0) 推荐(0) 编辑
摘要: 你已经了解了如何在你的程序中通过定义一次函数工作来重用代码。那么如果你 想在你所编写的别的程序中重用一些函数的话,应该怎么办?正如你可能想象到的那样,答 案是模块(Modules) 编写模块有很多种方法,其中最简单的一种便是创建一个包含函数与变量、以 .py 为后缀的 文件 from..import 阅读全文
posted @ 2020-09-27 21:59 曾庆林 阅读(179) 评论(0) 推荐(0) 编辑
摘要: 函数(Function)是指可重复使用的程序片段。它们允许你为某个代码块赋予名字,允许你 通过这一特殊的名字在你的程序任何地方来运行代码块,并可重复任何次数。这就是所谓的 调用函数。 我们已经使用过了许多内置的函数,例如 len 和 range 。 函数可以通过关键字 def 来定义。这一关键字后跟 阅读全文
posted @ 2020-09-27 21:54 曾庆林 阅读(245) 评论(0) 推荐(0) 编辑