听过N次还是不会之:浏览器输入url后到底经历了什么

有没有这种场景:当你被问起某一项知识点时,你大脑里想起经常看到过这样的问题,可是具体是怎么样就是说不清楚。
好吧,我就是这样的,于是整理一下,实在记不住,以后找起来也方便。
当你在浏览器地址栏里输入一个网址,比如:https://www.zhihu.com/,
我们就会看到知乎的首页。实际上背后的经过,是酱紫的。

一、浏览器解析输入的网址

首先,浏览器会解析我们输入的网址,那么https://www.zhihu.com/的域名是由什么组成的?

1.http

通常被译为超文本传输协议。不过我看书上说这种其实不严谨,严谨的翻译应该是“超文本转译协议”,不过我们不纠结这个,就知道是“超文本传输协议”就好了。这种协议用于客户端和服务端之间的通信。比如,你的浏览器就是客户端,而知乎的服务器就是服务端。

但是http本身有许多缺点:

  • 通信使用明文(不加密),内容可能会被窃听
  • 不验证通信方的身份,因此有可能遭遇伪装
  • 无法证明报文的完整性,所以有可能已遭篡改

其实也不仅是http协议,只要是未加密的协议都存在这种问题。
为了有效的防止这些问题,于是https诞生了。https=http+加密+认证+完整性保护。
具体不铺开了,推荐大家看一下《图解http》这本书,我这里也是借鉴于它。

2. www

World Wide Web,万维网。
CERN(欧洲核子研究组织)的蒂姆 • 伯纳斯 - 李(Tim BernersLee)博士提出了一种能让远隔两地的研究者们共享知识的设想。
最初设想的基本理念是:借助多文档之间相互关联形成的超文本(HyperText),连成可相互参阅的 WWW(World Wide Web,万维网)。
WWW 这一名称,是 Web 浏览器当年用来浏览超文本的客户端应用程序时的名称。现在则用来表示这一系列的集合,也可简称为 Web。
www与后面的zhihu.com一起构成了一个域名地址。

3. 解析域名

其实每个地址后面都有对应的ip地址,在真正发起请求之前,还需要进行DNS解析,解析出zhihu.com背后的ip地址是什么。

二、浏览器向服务器发起TCP连接,经历”三次握手”

在浏览器和服务器之间进行http请求,发送和返回这一来一去当中,是需要去创建一个TCP连接的。
因为http是不存在连接这么一个概念的,它只有一个请求和响应这么一个概念,那么请求和响应都是一个数据包,它们之间是需要一个传输的通道的,那么这个传输的通道在哪里呢?就在TCP里面。
TCP处于传输层,提供可靠的字节流服务。TCP协议为了更容易的传输大数据,会把数据进行分割,并且能够确认数据最终是不是送到了对方那里。
那如何能保证数据成功送达对方呢?“三次握手”就是保障通信可靠性的手段之一,顺序依次为:

  • 第一次握手:发送端发送带有SYN标志的数据包给对方。
  • 第二次握手:接收端接受到数据包后,回传一个带有SYN/ACK标志的数据包,表示已经收到了。
  • 第三次握手:发送端收到接收端的响应后,会再次回传一个带有ACK标志的数据包给接收端,结束。
    再借用下书里的图片加以解释一下,是不是更容易记住了。

我们也可以用wireshark来抓包看一下,在http请求之前是不是真的进行了TCP“三次握手”。(注:wireshark的用法还请感兴趣的小伙伴自行查阅)

以这个http请求为例,可以看到,在http之前是有3次TCP连接的。在TCP连接中,从上到下依次是按照上方介绍的“握手”顺序,握手完成后,才进行http请求。

三、握手完成,浏览器和服务器之间进行http请求交互

浏览器向服务器发送http请求,请求数据包,服务器处理收到的请求,将数据返回至浏览器。

四、浏览器解码服务器的响应

浏览器解码服务器的响应,如果响应支持缓存的话,浏览器就会存入缓存中去。那网页里通常还有各种图片呀,css,js等各种资源,浏览器则会发送对应的请求去获取这些被内嵌在html的资源。

五、页面渲染

各种资源浏览器都拿到了,那就可以在客户端里渲染出来了,丰富内容的网页最终呈现在我们面前。

posted @ 2020-06-05 16:11  把苹果咬哭的测试笔记  阅读(287)  评论(0编辑  收藏  举报