图解HTTP总结(1)——了解Web及网络基础
Web页面不能凭空显示出来。根据Web浏览器地址栏指定的URL,Web浏览器从Web服务器端获取文件资源等信息,从而显示出Web页面。
Web使用一种名为HTTP(HyperText Transfer Protocol,超文本传输协议)的协议作为规范,完成从客户端到服务端等一系列运作流程。而协议是指规则的约定。Web是建立在HTTP协议上通信的。
TCP/IP协议族按层次分别分为:应用层、传输层、网络层和数据链路层。好处是如果互联网只由一个协议统筹。某个地方需要修改设计时,就必须把所有部分整体替换掉。而分层之后只需要把变动的层替换掉即可。
应用层:决定了向用户提供应用服务时通信的活动。
传输层:对上层应用层提供处于网络连接中的两台计算机之间的数据传输。
网络层:用来处理网络上流动的数据包。
数据链路层:用来处理连接网络的硬件部分。
用HTTP举例说明,首先作为发送端的客户端在应用层(HTTP协议)发出一个想看某个Web页面的HTTP请求。接着,为了传输方便,在传输层(TCP协议)把从应用层收到的数据(HTTP请求报文)进行分割,并在各个报文上打上标记序号及端口号转发给网络层。在网络层(IP协议),增加作为通信目的地的MAC地址后转发给链路层。如此,发往网络的通信请求就准备齐全了。
接收端的服务器在链路层接收到数据,按序往上层发送,一直到应用层。当传输到应用层,才能算真正接收到由客户端发送过来的HTTP请求。
发送端在层与层之间传输数据时,每经过一层时必定会被打上一个该层所属的首部信息。反之,接收端在层与层传输数据时,每经过一层时会把对应的首部消去。
这种把数据信息包装起来的做法称为包装。
负责传输的IP协议
IP(Internet Protocol)网际协议位于网络层。
IP协议的作用是把各种数据包传送给对方。而要保证确实传送到对方那里,则需要满足各类条件。其中两个重要的条件是IP地址和MAC地址。
IP地址指明了节点被分配到的地址,MAC地址是指网卡所属的固定地址。IP地址可以和MAC地址进行配对。IP地址可变换,但MAC地址基本上不会更改。
确保可靠性的TCP协议
TCP位于传输层,提供可靠的字节流服务。
字节流服务:为了方便传输,将大块数据分割成以报文段(segment)为单位的数据包进行管理。而可靠的传输服务是指能够把数据准确可靠地传给对方。TCP协议为了更容易传送大数据才把数据分割,而且TCP协议能够确认数据最终是否送达对方。
为了准确无误的将数据送达目的地,TCP协议采用了三次握手策略,握手过程使用了TCP的标志(flg)——SYN(synchronize)和ACK(acknowledgement)。
发送端首先发送一个带SYN标志的数据包给对方。接收端收到后,回传一个带有SYN/ACK标志的数据包以示传达确认信息,最后,发送端再回传一个带ACK标志的数据包,代表“握手”结束。
负责域名解析的DNS服务
DNS(Domain Name System)服务是和HTTP协议一样位于应用层的协议。它提供域名到IP地址之间的解析服务。
各种协议与HTTP协议的关系
URI和URL
URL(Uniform Resource Locator,统一资源定位符)是使用Web浏览器等访问Web页面时需要输入的网页地址,如www.baidu.com
URI(Uniform Resource Identifier,统一资源标识符)是由某个协议方案表示的资源的定位标识符。协议方案是指访问资源所使用的协议类型名称,如采用HTTP协议时,协议方案就是http,此外还有ftp、mailto、telnet等。标准的URI协议方案有30种左右。
URI用字符串标识某一互联网资源,而URL表示资源的地点(互联网上所处的位置)。可见URL是URI的子集。
URI格式
绝对URI的格式
使用http:或https:等协议方案名获取访问资源时要指定协议类型。不区分字母大小写,最后附一个冒号(:)。也可以使用 data: 或javascript:这类指定数据或脚本程序的方案名。
指定用户名和密码作为从服务器端获取资源时必要的登录信息(身份认证)。此项是可选项。
服务器端口号:指定服务器连接的网络端口号。此项也是可选项,若用户省略则自动使用默认端口号。
带层次的文件路径:指定服务器上的文件路径来定位特指的资源。与Unix系统的文件目录结构类似。
查询字符串:针对已指定的文件路径内的资源,可以使用查询字符串传入任意参数。此项可选。
片段标识符:使用片段标识符通常可标记出已获取资源中的子资源(文档内的某个位置)。此项为可选项。