最近终于开始看《HTTP权威指南》了,第一章主要是简介一些基本的概念。下面列出一些常用,但还不是很了解的简单概念。
一、常见概念:
1、媒体类型
因特网上有数千种不同的数据类型,HTTP仔细地给每种要通过Web传输的对象都打上了名为MIME类型(MIME type)的数据格式标签。
MIME类型是一种文本标记,表示一种主要的对象类型和一个特定的子类型,中间由一条斜杠分隔。
格式:类型/格式
如:
HTML格式的文本文档由text/html类型来标记。 text是文档类型,html是格式。
普通的ASCII文本文档由text/plain类型来标记。
JPEG格式图片为image/jpeg类型。
GIF格式图片为image/gif类型。
Apple的QuickTime电影为video/quicktime类型。
微软的PowerPoing演示文件为application/vdn.ms-powerpoing类型。
2、URI
每个服务器里的资源文件都有一个名字,这样客户端就可以说明他们感兴趣的资源。
服务器资源名被称为:统一资源标识符(Uniform Resource Identifier,URI)。
URI就相当于邮政地址一样,用于标记一个资源文件,例如一个文件地址:
http://www.baidu.com/123.jpg 就是一个URI。
URI有两种形式,分别是URL和URN。URN仍处于试验阶段。
3、URL
统一资源定位符(URL)是资源标记符最常见的形式。URL描述了一台特定服务器上某资源的特定位置。
大部分URL都遵循一种标准格式,这种格式包含三个部分。
(1)、URL的第一部分被称为方案(scheme),说明了访问资源所使用的协议类型。这部分通常就是HTTP协议。
(2)、第二部分给出了服务器的因特网地址(比如:www.baidu.com)。
(3)、其余部分指定了Web服务器上的某个资源,比如(/123.jpg)。
4、Agent代理
用户Agent代理是代表用户发起HTTP请求的客户端程序。例如:浏览器,搜索引擎蜘蛛等。
5、网关
网关(gateway)是一种特殊的服务器,作为其他服务器的中间实体使用。通常用于将HTTP流量转换成其他协议。网关接受请求时就好像自己是资源的源端服务器一样。客户端可能并不知道自己正与一个网关进行通信。
6、缓存
Web缓存(Web cache)或代理缓存(proxy cache)是一种特殊的HTTP代理服务器,可以将经过代理传送的常用文档复制保存起来。下一次请求同意文档的客户端就可以享受缓存的私有副本所提供的服务了。
客户端从附近的缓存下载文档会比从远程Web服务器下载快得多。HTTP定义了很多功能,使得缓存更加高效,并规范了文档的新鲜度和缓存内容的隐私性。
二、HTTP过程
HTTP是基于的是TCP来传输其报文数据。
一个HTTP请求包括:建立连接,发送HTTP GET请求,从服务器读取HTTP响应,关闭连接。