CTF入门学习3->Web通信基础 | URL & HTTP

Web安全基础

01 Web通信

这个部分重点介绍浏览器与Web服务器的详细通信过程。

01-00 URL协议

只要上网访问服务器，就离不开URL。

URL是什么？

URL就是我们在浏览器里输入的站点链接。又叫做“统一资源定位符”（Uniform Resource Locator)。

URL支持很多协议，比如HTTP、FTP等等。

PS：HTTP和URL有何区别？

答：（来源(https://www.jianshu.com/p/4fb712c05b63)

HTTP：（Hypertext transfer protocol）超文本传输协议，是用于从万维网（WWW:World Wide Web）服务器传输超文本到本地浏览器的传送协议。

URL：（Uniform Resource Locator）统一资源定位符，对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示，是互联网上标准资源的地址。

URL有什么作用？

URL的作用就是定位服务器的资源。

那如何才能定位到网站（服务器）的资源呢？

我们来设想一下：我们在网上购买的东西是如何寄到我们手上的呢？

我们提供了我们的收货地址。

在Web的世界中，URL就充当了收货地址的角色。

浏览器通过URL，可以定位到服务器的资源，然后将服务器的资源展示给我们。

这个“收货地址”有一定的格式：

schema://host[:port#]/path/.../[?query-string] [#anchor]

schema:底层协议如http、https、ftp等；

host:服务器的域名或者IP地址；

:port# : 服务器端口，HTTP默认端口是80(可以省略)，其他端口需要指明；

/path: 访问资源的路径；

?query-string: 发送给服务器的数据；

#anchor: 锚；通常表示在页面的特定位置。

所有的URL都遵循这个URL标准。

URL实例

例如这个URL:http://dun.163.com/sj/test/test.jsp?name=sviergn&x=true#stuff

逐一解析：

schema：http协议；

host：dun.163.com；没有指明端口，默认80

/path：/sj/test/test.jsp，访问资源的路径；

?query-string：?name=sviergn&x=true；

anchor：#stuff

这一部分需要常忆常用。

01-01 HTTP协议

HTTP就是Web通信时使用的协议，也是Web建立的基础；是网络上应用最广的一种协议。

什么是HTTP？

HTTP又称超文本传输协议；英文名：Hyper Text Transfer Protocol;

为了了解这一协议的过程，我们拿快递小哥的工作打比方：

快递小哥首先通过货车派送货物，当货物送到我们的收货地址的时候，快递小哥就会打电话联系我们，说是某某公司的快递员，要我们来取件。
如果要让快递小哥送进小区里面，我们就需要告诉物业准许他进入，相当于给他颁了个通行证；
当快递小哥将货物送到我们手上，我们需要签收，快递小哥拿到快递单，就完成了一次快递任务。

HTTP协议类似。

浏览器：快递小哥
快递小哥通过货车送货：浏览器通过Get方式发送请求。
HTTP中的Host就相当于“收件人地址”；
User-Agent就相当于快递小哥所处的公司；
HTTP包含的Cookie就相当于能够进入我们小区的凭证。
当服务器收到浏览器的HTTP请求后，会返回一个状态码（对应收到这个事实）和相应内容（对应已签收的字据）。状态码为200表示正常收到（状态码可以在上文中/前一篇的开发者工具的网络中查看）

可以看到HTTP协议的请求和响应包含了一些特殊的属性，包含方式、User-Agent、Host、返回的状态码等等；

上面这些都属于HTTP的报文。

什么是HTTP的报文？

分为三部分：起始行、头、身体

左边，是浏览器发送的HTTP请求报文，右边是服务器返回的HTTP请求报文；

左侧
- 第一行：请求行Request Line
- 之后：是我们的头部Headers；
- 下面：应该是我们的数据体，但由于是GET请求，没有数据体
- 注意头部和数据体之间是有一个空行的。
右侧
- 第一行：状态行；
  - 比如：HTTP/1.1 200 OK
- 头部
- 主体：也就是响应的正文
- 注意响应的头部和主题之间也是有一行空行的。

HTTP请求示例

比如一个发帖的HTTP请求

当我们进行发帖的时候，我们的请求报文和响应报文如下：

请求
- 第一行：请求行
  - 这里是POST
- Headers
  - 相较于上面，多了一个Cookie字段，就是前面提到的用户凭证，相当于告诉服务器，是我发的这个帖子。
  - 黑客就比较喜欢获取这个Cookie凭证，如果获取，就拥有了“我”的凭证，可以以“我”的身份发帖。
  - 后面会接触一些这方面的安全漏洞。
- 也有了数据体
  - 就是要发布的帖子的相关内容

HTTP请求的其他方法

HEAD
- 与GET请求类似，不同是只返回HTTP的头部信息，没有数据体，也就没有页面内容。
PUT
- 上传指定的URL描述
DELETE
- 删除指定资源
OPTIONS
- 返回服务器支持的HTTP方法

01-02 HTTP头的Referer

这是除了HTTP请求方式和Cookie的概念外，另一个重要概念。

Referer就是告诉服务器，我们从什么地方来（即告诉物业我们是哪个快递公司的）；

举例：

我们通过https://m.study.163.com/直接跳转到页面。和从bing主页搜索云课堂再进入，开发者工具中显示的HTTP请求是不同的，后者会多一个Referer头，表示是从bing的这个链接来的。

如图；图一是直接跳转；图二是搜索跳转；

直接跳转Rerfer

搜索跳转的Rerfer与之不同。

所以由于Referer可以告诉服务器该次请求的来源，所以很多Web服务器会通过Referer来进行统计（比如CNZZ、百度统计）

从安全的角度来讲，Referer还可以用来判断来源是否合法。

（比如：

防止盗链
- 比如一些网站不想被盗用内容或恶意引用，就会通过Referer限制来者
防止CSRF漏洞
- （暂不了解

01-03 HTTP状态码

302 --跳转

比如：在响应报文的状态行（第一行）

HTTP/1.1 302 Moved Temporarily

在跳转同时，还会在响应报文的Headers部分有一个Location字段，是跳转到的URL地址，也就是这个响应报文告诉我们，我们需要跳转到Location中的URL地址。

除了这两处，还会有Set-Cookie字段，作用是Web服务器向我们的浏览器颁发凭证，比如我们通过用户名密码登录成功后，Web服务器通常就会给我们颁发一个凭证。

类似的是301。

除此之外，还包括10x，20x，30x，40x，50x；每个状态码都代表不同的意思。

分类	分类描述
10x	信息，服务器收到请求，需要请求者继续执行操作
20x	成功，操作被成功接收并处理
30x	重定向，需要进一步的操作以完成请求
40x	客户端错误，请求包含语法错误或无法完成请求
50x	服务器错误，服务器在处理请求的过程中发生了错误

具体的状态码可以到后面再学习，或用到查看。

01-04 实例演示

我们打开Edge浏览器，输入https://www.cnblogs.com/Roboduster

我们用F12打开开发者工具，进入“网络”，刷新一下，查看“文档”，选中head头，可以看到有请求头、响应头，点击就可以看源码，有一些是上面讲过的，还有些字段是不熟悉的。这些字段可以自行查阅。

除了HEADER外，我们可以看一看响应的具体内容，在左侧的“响应”中；Cookie中有请求的Cookie等等。

posted @ 2021-11-19 21:27 climerecho 阅读(1066) 评论(1) 收藏举报

刷新页面返回顶部

Clivia Du

A student of CS who enjoys electronic design