用户访问网站的完整流程


 

 

在浏览器输入想要访问的域名之后,浏览器会进行域名解析获得IP地址,在经过TCP的连接,实现数据的传输就会有两种报文,及请求报文和响应报文。最终才能实现通信。因此想要实现通信,就得先弄懂DNS的解析原理以及TCP连接通道的流程。

 

理论内容:

1、DNS的介绍以及原理

2、TCP/IP协议的介绍和三次握手及四次挥手

3、HTTP协议的介绍及请求与响应报文

4、用户访问浏览器的完整过程

 

1、DNS的介绍及解析原理

1)说说DNS是什么:

DNS(Domain Name System,域名系统),因特网上作为域名和IP地址相互映射的一个分布式数据库,能够使用户更方便的访问互联网,而不用去+·记住能够被机器直接读取的IP数串。通过主机名,最终得到该主机名对应的IP地址的过程叫做域名解析(或主机名解析)。DNS协议运行在UDP协议之上,使用端口号53。访问网站的实质就是解析其域名得到IP地址,再转向其网站。

 

2)DNS的解析原理:

 

 

 

 

原理步骤:

1)系统首先会查找本地的DNS缓存和hosts文件信息,确认其中是否有与域名www.qq.com所对应的IP地址。如果有,就直接访问这个IP地址所对应的www.qq.com域名服务器。

2)如果没有找到,那么,系统将会把浏览器的解析请求发送给本地主机所指定的DNS服务器,称为LDNS。如果LDNS服务器中有域名www.qq.com所对应的IP地址,则返回给客户端的浏览器,如果没有,则继续请求其他DNS服务器。

3)LDNS服务器会从DNS系统的根(.)开始请求对域名www.qq.com的解析。根DNS服务器全球只有13台,根域名服务器是没有域名www.qq.com解析记录的。但是它会有域名www.qq.com所对应的顶级域.com的解析记录,因此直接把顶级域.com所对应的DNS地址返回给LDNS服务器。

4)LDNS服务器获取到顶级域.com对应的DNS服务器地址后,就会去.com服务器请求对www.qq.com域名的解析。在顶级域名服务器也不会有www.qq.com的解析记录的。但是它有www.qq.com的父级域名的解析记录,即qq.com。因此顶级域名.com服务器又会把qq.com所对应的DNS服务器的IP地址返回给LDNS。

5)LDNS服务器收到qq.com所对应的IP地址后,就会去qq.com域名服务器请求对www.qq.com的域名解析。qq.com域名对应的DNS服务器是该域名的授权DNS服务器。这个DNS服务器就是企业购买域名时用于管理解析的服务器。

6)qq.com域名DNS服务器会把www.qq.com域名所对应的IP地址给解析出来,然后发给LDNS。

7)LDNS把解析出来的结果www.qq.com所对应的IP地址发送给客户端的浏览器。并且LDNS也会将其域名和对应的地址缓存到cache中。

8)客户端浏览器收到后,也会将其域名以及对应的IP地址缓存的到DNS缓存里。

 

2、TCP/IP协议的介绍和三次握手及四次挥手

 

TCP 标志位及参数含义

TCP 三次握手中涉及的重要标志位和参数包括 SEQ(序列号)、ACK(确认号)、SYN 和其他标志位

  • SYN 用于连接建立时的同步。
  • SEQ(序列号)用于标记数据的顺序。
  • ACK(确认号)用于确认接收到的数据。

1)说说TCP/IP协议是什么

Transmission Control Protocol/Internet Protocol的简写,中译名为传输控制协议/因特网互联协议,又名网络通讯协议,是Internet最基本的协议、Internet国际互联网络的基础,由网络层的IP协议和传输层的TCP协议组成。TCP/IP 定义了电子设备如何连入因特网,以及数据如何在它们之间传输的标准。协议采用了4层的层级结构,每一层都呼叫它的下一层所提供的协议来完成自己的需求。通俗而言:TCP负责发现传输的问题,一有问题就发出信号,要求重新传输,直到所有数据安全正确地传输到目的地。而IP是给因特网的每一台联网设备规定一个地址。

2)各个状态的意义如下: 
(1)LISTEN - 侦听来自远方TCP端口的连接请求; 
(2)SYN-SENT -在发送连接请求后等待匹配的连接请求; 
(3)SYN-RECEIVED - 在收到和发送一个连接请求后等待对连接请求的确认; 
(4)ESTABLISHED- 代表一个打开的连接,数据可以传送给用户; 
(5)FIN-WAIT-1 - 等待远程TCP的连接中断请求,或先前的连接中断请求的确认;
(6)FIN-WAIT-2 - 从远程TCP等待连接中断请求; 
(7)CLOSE-WAIT - 等待从本地用户发来的连接中断请求; 
(8)CLOSING -等待远程TCP对连接中断的确认; 
(9)LAST-ACK - 等待原来发向远程TCP的连接中断请求的确认; 
(10)TIME-WAIT - 等待足够的时间以确保远程TCP接收到连接中断请求的确认; 
(11)CLOSED - 没有任何连接状态;

3)TCP三次握手

所谓三次握手(Three-way Handshake),是指建立一个TCP连接时,需要客户端和服务器总共发送3个包。

三次握手的目的是连接服务器指定端口,建立TCP连接,并同步连接双方的序列号和确认号并交换 TCP 窗口大小信息.在socket编程中,客户端执行connect()时。将触发三次握手。

 

 

 

 

 

 

三次握手过程:

 

  • 一次握手:客户端发送带有 SYN(SEQ=x) 标志的数据包 -> 服务端,然后客户端进入 SYN_SENT 状态,等待服务端的确认;
  • 二次握手:服务端发送带有 SYN+ACK(SEQ=y,ACK=x+1) 标志的数据包 –> 客户端,然后服务端进入 SYN_RECV 状态;
  • 三次握手:客户端发送带有 ACK(ACK=y+1) 标志的数据包 –> 服务端,然后客户端和服务端都进入ESTABLISHED 状态,完成 TCP 三次握手。

 

 

 

4)TCP 四次挥手
TCP的连接的拆除需要发送四个包,因此称为四次挥手(four-way handshake)。客户端或服务器均可主动发起挥手动作,在socket编程中,任何一方执行close()操作即可产生挥手操作。

 

 

 

 

 

 

 

四次挥手过程:

  • 第一次挥手:客户端发送一个 FIN(SEQ=x) 标志的数据包->服务端,用来关闭客户端到服务端的数据传送。然后客户端进入 FIN-WAIT-1 状态。
  • 第二次挥手:服务端收到这个 FIN(SEQ=X) 标志的数据包,它发送一个 ACK (ACK=x+1)标志的数据包->客户端 。然后服务端进入 CLOSE-WAIT 状态,客户端进入 FIN-WAIT-2 状态。
  • 第三次挥手:服务端发送一个 FIN (SEQ=y)标志的数据包->客户端,请求关闭连接,然后服务端进入 LAST-ACK 状态。
  • 第四次挥手:客户端发送 ACK (ACK=y+1)标志的数据包->服务端,然后客户端进入TIME-WAIT状态,服务端在收到 ACK (ACK=y+1)标志的数据包后进入 CLOSE 状态。此时如果客户端等待 2MSL 后依然没有收到回复,就证明服务端已正常关闭,随后客户端也可以关闭连接了。

3、HTTP协议的介绍及请求与响应报文

1)HTTP报文

HTTP报文中有很多行内人,这些行的字段都是由一些ASCII码串组成,但各个字段的长度是不同的。HTTP报文可以分为两种,一种是从web客户端发往web服务端的HTTP报文,称为请求报文,另一种是从web服务端发往客户端的报文,称为响应报文。两种报文的格式的基本相同。

(1)请求报文介绍

(2)请求报文的内容与格式有如下:

1)请求行

作用:用来说明客户端想要做什么。

内容:包括方法字段GET和URL字段以及HTTP协议版本

2)请求头

作用:通过客户端把请求的相关信息发给服务器

内容:包括媒体类型、语言类型、支持压缩、客户端类型、主机等信息。

3)空行

作用:告诉服务器空行以下内容不属于请求头部信息。

4)请求报文主体

作用:用来说明客户端具体想要做的事情。

内容:查看信息、应用post方法。

(3)响应报文介绍

(4)请求报文的内容与格式有如下:

1)状态行

作用:用来说明服务端响应客户端的状态。

内容:包括协议及版本号、数字状态码、状态情况

2)响应头

作用:通过服务端把响应的相关信息给客户端

内容:包括Location、server、connect、vary等

3)空行

作用:告诉客户端空行以下内容不属于响应头部信息。

4)响应报文主体

作用:用来装载着要返回给客户端的数据

内容:包括文本、html、视频或者是图片。

 

(5)GET与POST的认识

GET:当客户端要从服务器中读取某个资源时,使用GET 方法。GET 方法要求服务器将URL 定位的资源放在响应报文的数据部分,回送给客户端,即向服务器请求某个资源。使用GET 方法时,请求参数和对应的值附加在 URL 后面,利用一个问号(“?”)代表URL 的结尾与请求参数的开始,传递参数长度受限制。例如,/index.jsp?id=100&op=bind、

POST:当客户端给服务器提供信息较多时可以使用POST 方法,POST 方法向服务器提交数据,比如完成表单数据的提交,将数据提交给服务器处理。GET 一般用于获取/查询资源信息,POST 会附带用户数据,一般用于更新资源信息。POST 方法将请求参数封装在HTTP 请求数据中,以名称/值的形式出现,可以传输大量数据;

 

4、用户访问浏览器的完整过程

1、客户端在浏览器中输入要访问的域名地址,如:www.baidu.com

2、浏览器请求解析DNS服务器,把域名www.baidu.com转换成web服务器的IP地址。

1)系统首先会查找本地的DNS缓存和hosts文件信息,确认其中是否有与,域名www.baidu.com所对应的IP地址。如果有,就直接访问这个IP地址所对应的www.baidu.com域名服务器。

2)如果没有找到,那么,系统将会把浏览器的解析请求发送给本地主机所指定的DNS服务器,称为LDNS。如果LDNS服务器中有域名www.baidu.com所对应的IP地址,则返回给客户端的浏览器,如果没有,则继续请求其他DNS服务器。

3)LDNS服务器会从DNS系统的根(.)开始请求对域名www.baidu.com的解析。根DNS服务器全球只有13台,根域名服务器是没有域名www.baidu.com解析记录的。但是它会有域名www.baidu.com所对应的顶级域.com的解析记录,因此直接把顶级域.com所对应的DNS地址返回给LDNS服务器。

4)LDNS服务器获取到顶级域.com对应的DNS服务器地址后,就会去.com服务器请求对www.baidu.com域名的解析。在顶级域名服务器也不会有www.baidu.com的解析记录的。但是它有www.baidu.com的父级域名,即baidu.com。因此顶级域名.com服务器又会把baidu.com所对应的DNS服务器的IP地址返回给LDNS。

5)LDNS服务器收到baidu.com所对应的IP地址后,就会去baidu.com域名服务器请求对www.baidu.com的域名解析。Baidu.com域名对应的DNS服务器是该域名的授权DNS服务器。这个DNS服务器就是企业购买域名时用于管理解析的服务器。

6)baidu.com域名DNS服务器会吧www.baidu.com域名所对应的IP地址给解析出来,然后发给LDNS。

7)LDNS把解析出来的结果,www.baudu.com所对应的IP地址发送给客户端的浏览器。并且LDNS也会将其域名和对应的地址缓存到cache中,当下次有用户请求相同的域名时,LDNS 可以直接从缓存中返回结果,而无需再次向上级 DNS 查询

8)客户端浏览器收到后,也会将其域名以及对应的IP地址缓存的到DNS缓存中。

3、浏览器从访问的IP地址(URL)解析出默认的端口号:80

4、浏览器通过解析后得到的IP地址和端口号进行web服务器建立一条TCP连接通道。

1)第一次握手:

建立连接时,客户端A发送SYN包(SYN=j)到服务器B,并进入SYN_SEND状态,等待服务器B确认。

2)第二次握手:

服务器B收到SYN包,必须确认客户A的SYN(ACK=j+1),同时自己也发送一个SYN包(SYN=k),即SYN+ACK包,此时服务器B进入SYN_RECV状态。

3)第三次握手:

客户端A收到服务器B的SYN+ACK包,向服务器B发送确认包ACK(ACK=k+1),此包发送完毕,客户端A和服务器B进入ESTABLISHED状态,完成三次握手。

 

5、建立TCP连接之后,浏览器向web服务器发送一条HTTP请求报文。

1)请求行

作用:用来说明客户端想要做什么。

内容:包括方法字段GET和URL字段以及HTTP协议版本

2)请求头

作用:通过客户端把请求的相关信息发给服务器

内容:包括媒体类型、语言类型、支持压缩、客户端类型、主机等信息。

3)空行

作用:告诉服务器空行以下内容不属于请求头部信息。

4)请求报文主体

作用:用来说明客户端具体想要做的事情。

内容:查看信息、应用post方法。

6、web服务器响应并读取浏览器的请求信息,然后返回一条HTTP响应报文。

1)状态行

作用:用来说明服务端响应客户端的状态。

内容:包括洗衣及版本号、数字状态码、状态情况

2)响应头

作用:通过服务端把响应的相关信息给客户端

内容:包括Location、server、connect、vary等

3)空行

作用:告诉客户端空行以下内容不属于响应头部信息。

4)响应报文主体

作用:用来装载着要返回给客户端的数据

内容:包括文本、html、视频或者是图片。

7、web服务器关闭HTTP连接,关闭TCP连接,web服务器显示访问的网站内容到屏幕上。

1)第一次挥手:

客户端A发送一个FIN,用来关闭客户A到服务器B的数据传送。 

2)第二次挥手:

服务器B收到这个FIN,它发回一个ACK,确认序号为收到的序号加1。和SYN一样,一个FIN将占用一个序号。 

3)第三次挥手:

服务器B关闭与客户端A的连接,发送一个FIN给客户端A。 

4)第四次挥手:

客户端A发回ACK报文确认,并将确认序号设置为收到序号加1。

 

 

 

缓存查询顺序

客户端查询 DNS 缓存的顺序通常为:

 

  1. 浏览器缓存
  2. 操作系统的 DNS 缓存
  3. 本地 hosts 文件(如果命中,不会发起网络请求)。
  4. DNS 服务器(LDNS 等)

 

posted @   暗光888  阅读(100)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
点击右上角即可分享
微信分享提示