随笔- 59 文章- 5 评论- 0 阅读- 78249

渗透之路（一）——HTTP协议详解

1. HTTP简介
HTTP(Hyper Text Transfer Protocol 超文本传输协议），是互联网上应用最为广泛的一种网络协议。基于TCP/IP通信协议来传递数据（HTML文件，图片文件，查询结果等）
目前HTTP的版本是HTTP/1.1，HTTP/2.0正在设计当中

2. HTTP工作原理
HTTP协议采用C/S的工作架构，通常我们使用浏览器充当客户端角色通过URL（传输数据和建立连接）向HTTP服务端（WEB服务器）发送所有请求。
对于HTTP协议的工作原理可以简单的用下图作以理解

3. 值得一提的HTTP

HTTP是无连接的，无连接的意思就是每次连接只处理一个请求，像上图描述的一个请求响应来回之后，便断开连接。这种方式可以节省信息传输的时间
HTTP是无状态的，协议自身不对请求和响应之间的同行状态进行保存。也就是说，协议对于发送过的请求和响应都不做持久化处理。但是随着web的发展，因为无状态而导致业务处理变得棘手的情况增多了。比如登录CSDN的网站，我要跳转到该站的其他页面后，也需要保持登录的状态，因为网站需要知道是谁发出的这个请求。于是HTTP/1.1引入了cookie技术，用以实现期望的保持状态功能。
HTTP是媒体独立的，也就是说，只要服务端和客户端知道处理数据的方式，那么任何类型的数据都可以通过http协议发送。
值得一提的URL的格式
首先URL（Uniform Resource Locator 统一资源定位符）用来描述一个网络上的资源。基本格式如下

schema://host[:port#]/path/.../[;url-params][?query-string][#anchor]*

schema 指定低层使用的协议（例如：http,https,ftp）
host HTTP服务器的IP地址或者域名
port# HTTP服务器的端口号，默认80
path 访问资源的路径
url-params
query-string
(这两个东西就是发送给http服务器的数据，那么怎么去理解他呢首先我们要搞清楚什么是params，什么是query。简单的理解：
params：/router1/:id ，/router1/123，/router1/789 ,这里的id叫做params

query：/router1?id=123 ,/router1?id=456 ,这里的id叫做query。
anchor 锚
Anchor 对象表示 HTML 超链接
在 HTML 文档中 a 标签每出现一次，就会创建 Anchor 对象；
锚可用于创建指向另一个文档的链接（通过 href 属性），或者创建文档内的书签（通过 name 属性）；

4. HTTP消息结构

HTTP请求消息
一个HTTP请求报文由请求行（request line）、请求头部（header）、空行和请求数据4个部分组成，下面是请求报文的一般格式。

<request-line> //请求行

<headers> //请求头

<blank line> //空格

<request-body> //请求数据

1.请求行

请求行由请求方法字段、URL字段和HTTP协议版本字段3个字段组成，它们用空格分隔。例如，GET /index.html HTTP/1.1。
HTTP协议的请求方法有GET、POST、HEAD、PUT、DELETE、OPTIONS、TRACE、CONNECT。

1 GET 请求指定的页面信息，并返回实体主体
2 HEAD 类似于get请求，只不过返回的响应中没有具体的内容，用于获取报头
3 POST 向指定资源提交数据进行处理请求（例如提交表单或者上传文件）。数据被包含在请求体中。POST请求可能会导致新的资源的建立或已有的资源的修改
4 PUT 从客户端向服务器传送的数据取代指定的文档的内容
5 DELET 请求服务器删除指定的页面
6 CONNECT HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器
7 OPTIONS 允许客户端查看服务器的性能
8 TRACE 回显服务器收到的请求，主要用于测试或诊断

2.请求头部　

　　请求头部由关键字/值对组成，每行一对，关键字和值用英文冒号“:”分隔。请求头部通知服务器有关于客户端请求的信息，典型的请求头有：
　　User-Agent：产生请求的浏览器类型。
　　Accept：客户端可识别的内容类型列表。
　　Host：请求的主机名，允许多个域名同处一个IP地址，即虚拟主机。
　　例子：

应答头说明

Content-Encoding 文档的编码（Encode）方法。解码后才可以得到Content-Type头指定的内容类型。

Content-Length 表示内容长度。只有当浏览器使用HTTP连接时才需要这个数据。例如，下载数据时，通过它查看字节大小
Content-Type 　　表示后面的文档是属于什么MIME类型。Servlet默认为text/plain，但最好显式指出
Date 　　　　　　  当前的GMT时间（格林威治时间）
Expires 　　　　　表示在什么时候认为文档已经过期，从而不再缓存它
Last-Modified 　　文档的最后改动时间
Location 　　　　文档位置，表示客户端应该到那提取文档
Refresh 　　　　   表示浏览器应该在多少时间后刷新文档或页面（只一次，非重复），以秒计。Refresh不属于HTTP1.1正式规范中，而是一个扩展，但Netscape和IE都支持它
Server 　　　　   服务器名字
Set-Cookie 　　　设置页面相关的Cookie

WWWW-

Authenticate 表示客户端需要在其中提供某类型的授权信息。例如，在包含401状态行的应答中，这个头就需要设置

　　一般来说，请求头里面包含着客户端此次请求的具体信息：
　　比如说，客户端接受服务器返回的文件的类型，Content-Type
　　客户端此次接受服务器返回文件的长度，Content-Length
　　客户端想要的返回文件的具体范围，Range
　　客户端的语言环境等，都是包含在请求头里面的。知道这些信息，我们就可以加以利用，来达到想要的效果。
3.空行

最后一个请求头之后是一个空格，告诉服务器下面不再是请求头了

4.请求数据

　一般是post请求才有请求主题body，例如表单提交等，现在多用的是json格式的请求体

4.HTTP响应报文

HTTP相应也是由三个部分组成，分别是：状态行、响应头、响应正文

<status-line> #状态行

<headers> #响应头部

<blank line> #空格

<reponse-body> #响应正文

协议版本状态码

HTTP/1.1 200 OK

Date: Tue, 10 Jul 2012 06:50:15 GMT ——响应报头

Content-Length:362

Content-Type:text/html

1.状态行

通过一个状态码反应资源请求情况

1XX：只是信息--请求已经接收，继续处理

2XX：成功--表示请求已经被接收成功

3XX：重定向--请求需要进行跳转操作

4XX：服务器端错误--服务器未能实现合法请求

常见的状态码：

200 OK：客户端请求成功。

302 redirect: 302：重定向
400 Bad Request：客户端请求有语法错误，不能被服务器所理解。
401 Unauthorized：请求未经授权，这个状态代码必须和WWW-Authenticate报头域一起使用。
403 Forbidden：服务器收到请求，但是拒绝提供服务。
404 Not Found：请求资源不存在，举个例子：输入了错误的URL。
500 Internal Server Error：服务器发生不可预期的错误。
503 Server Unavailable：服务器当前不能处理客户端的请求，一段时间后可能恢复正常，举个例子：HTTP/1.1 200 OK（CRLF）。

2.响应头部

也是就服务器返回给客户端服务器自己的具体信息，和请求头部表达的意思是一样的

3.空行

最后一个响应头之后是一个空格，告诉服务器下面不再是响应头了

4.响应正文

服务器返回的资源信息，get请求的资源，或者post提交数据的结果或者返回资源信息

posted @ 2019-11-09 16:28 飞羽小鱼仔阅读(429) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源！
· 周边上新：园子的第一款马克杯温暖上架

公告

Document

昵称：飞羽小鱼仔
园龄： 7年3个月
粉丝： 3
关注： 8

+加关注

2025年3月

日

一

二

三

四

五

六

飞羽小鱼仔

渗透之路（一）——HTTP协议详解

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

文章分类

阅读排行榜

推荐排行榜