网路通信----笔记

正版 Visual C++网络通信开发入门与编程实践-------- 李媛媛

编辑推荐

超长时间多媒体有声讲解视频
　　全书以通信协议层的技术为主线
　　按网络体系结构从应用层到数据链路层逐一讲解
　　实例完美融合知识点、技巧、行业知识与成功经验

内容提要

本书从介绍通信基础知识和VC++基本编程模型开始，通过众多的小实例来贯穿讲解晦涩的基础知识；然后按照通信协议层展开，将通信协议层和实际应用结合，让读者在学习“基础”后学习中、高级应用，最终提高实际应用水平和独立编程技能；本书最后部分的综合案例，可以让读者对前面学习的内容融会贯通，以便深刻理解与实践应用。
　　本书的特点是：以通信协议层的技术为主线，在此基础上讲解各技术的应用范围，再通过众多小、中、大型实例来全面而生动地讲解VC++的知识，既能让读者全面地学习VC++技术，又能让读者联系实际，从而摆脱单纯讲解软件功能的枯燥学习模式。本书在讲解VC++的过程中还穿插大量提示和技巧，并对复杂和容易忽略的问题进行单独说明。书中的实例制作深入浅出，步骤详细清晰，可以帮助读者轻松、快速地学习VC++，能够保证对VC++不了解的读者也可以轻松学习。同时对实例进行细致的选择，使本书将知识点、技巧、行业知识和成功经验完美地融合到实例中，也让中级读者感觉物有所值。
　　本书所配光盘中包含多媒体视频教学和实例源文件。
　　本书适合VC++初、中级自学用户及VC++设计爱好者，同时也可作为计算机技能中级培训教材。

第1章　Visual C++网络通信基础
1.1 计算机网络的组成及体系结构
1.1.1　网络边缘
1.1.2　网络核心
1.1.3　计算机网络的分层体系结构
1.2　初识Windows Sockets编程规范
1.2.1 Windows Sockets的相关概念
1.2.2 Winsock技术特点
1.2.3 Winsock编程原理

2.2.2 服务方式

UNIX系统的I/O命令集，是从Maltics和早期系统中的命令演变出来的，其模式为打开一读/写一关闭（open-write-read- close）。在一个用户进程进行I/O操作时，它首先调用"打开"获得对指定文件或设备的使用权，并返回称为文件描述符的整型数，以描述用户在打开的文件或设备上进行I/O操作的进程。然后这个用户进程多次调用"读/写"以传输数据。当所有的传输操作完成后，用户进程关闭调用，通知操作系统已经完成了对某对象的使用。
TCP/IP协议被集成到UNIX内核中时，相当于在UNIX系统引入了一种新型的I/O操作。UNIX用户进程与网络协议的交互作用比用户进程与传统的 I/O设备相互作用复杂得多。首先，进行网络操作的两个进程在不同机器上，如何建立它们之间的联系？其次，网络协议存在多种，如何建立一种通用机制以支持多种协议？这些都是网络应用编程界面所要解决的问题。
在UNIX系统中，网络应用编程界面有两类：UNIX BSD的套接字（socket）和UNIX System V的TLI。由于Sun公司采用了支持TCP/IP的UNIX BSD操作系统，使TCP/IP的应用有更大的发展，其网络应用编程界面──套接字（socket）在网络软件中被广泛应用，至今已引进微机操作系统 DOS和Windows系统中，成为开发网络应用软件的强有力工具，本章将要详细讨论这个问题。
2.2 套接字编程基本概念
在开始使用套接字编程之前，首先必须建立以下概念。
2.2.1 网间进程通信
进程通信的概念最初来源于单机系统。由于每个进程都在自己的地址范围内运行，为保证两个相互通信的进程之间既互不干扰又协调一致工作，操作系统为进程通信提供了相应设施，如UNIX BSD中的管道（pipe）、命名管道（named pipe）和软中断信号（signal），UNIX system V的消息（message）、共享存储区（shared memory）和信号量（semaphore)等，但都仅限于用在本机进程之间通信。网间进程通信要解决的是不同主机进程间的相互通信问题（可把同机进程通信看作是其中的特例）。为此，首先要解决的是网间进程标识问题。同一主机上，不同进程可用进程号（process ID）唯一标识。但在网络环境下，各主机独立分配的进程号不能唯一标识该进程。例如，主机A赋于某进程号5，在B机中也可以存在5号进程，因此，"5号进程"这句话就没有意义了。
其次，操作系统支持的网络协议众多，不同协议的工作方式不同，地址格式也不同。因此，网间进程通信还要解决多重协议的识别问题。
为了解决上述问题，TCP/IP协议引入了下列几个概念。
端口
网络中可以被命名和寻址的通信端口，是操作系统可分配的一种资源。
按照OSI七层协议的描述，传输层与网络层在功能上的最大区别是传输层提供进程通信能力。从这个意义上讲，网络通信的最终地址就不仅仅是主机地址了，还包括可以描述进程的某种标识符。为此，TCP/IP协议提出了协议端口（protocol port，简称端口）的概念，用于标识通信的进程。
端口是一种抽象的软件结构（包括一些数据结构和I/O缓冲区）。应用程序（即进程）通过系统调用与某端口建立连接（binding）后，传输层传给该端口的数据都被相应进程所接收，相应进程发给传输层的数据都通过该端口输出。在TCP/IP协议的实现中，端口操作类似于一般的I/O操作，进程获取一个端口，相当于获取本地唯一的I/O文件，可以用一般的读写原语访问之。
类似于文件描述符，每个端口都拥有一个叫端口号（port number）的整数型标识符，用于区别不同端口。由于TCP/IP传输层的两个协议TCP和UDP是完全独立的两个软件模块，因此各自的端口号也相互独立，如TCP有一个255号端口，UDP也可以有一个255号端口，二者并不冲突。
端口号的分配是一个重要问题。有两种基本分配方式：第一种叫全局分配，这是一种集中控制方式，由一个公认的中央机构根据用户需要进行统一分配，并将结果公布于众。第二种是本地分配，又称动态连接，即进程需要访问传输层服务时，向本地操作系统提出申请，操作系统返回一个本地唯一的端口号，进程再通过合适的系统调用将自己与该端口号联系起来（绑扎）。TCP/IP端口号的分配中综合了上述两种方式。TCP/IP将端口号分为两部分，少量的作为保留端口，以全局方式分配给服务进程。因此，每一个标准服务器都拥有一个全局公认的端口（即周知口，well-known port），即使在不同机器上，其端口号也相同。剩余的为自由端口，以本地方式进行分配。TCP和UDP均规定，小于256的端口号才能作保留端口。
地址
网络通信中通信的两个进程分别在不同的机器上。在互连网络中，两台机器可能位于不同的网络，这些网络通过网络互连设备（网关，网桥，路由器等）连接。因此需要三级寻址：
1. 某一主机可与多个网络相连，必须指定一特定网络地址；
2. 网络上每一台主机应有其唯一的地址；
3. 每一主机上的每一进程应有在该主机上的唯一标识符。
通常主机地址由网络ID和主机ID组成，在TCP/IP协议中用32位整数值表示；TCP和UDP均使用16位端口号标识用户进程。
网络字节顺序
不同的计算机存放多字节值的顺序不同，有的机器在起始地址存放低位字节（低价先存），有的存高位字节（高价先存）。为保证数据的正确性，在网络协议中须指定网络字节顺序。TCP/IP协议使用16位整数和32位整数的高价先存格式，它们均含在协议头文件中。
连接
两个进程间的通信链路称为连接。连接在内部表现为一些缓冲区和一组协议机制，在外部表现出比无连接高的可靠性。
半相关
综上所述，网络中用一个三元组可以在全局唯一标志一个进程：
（协议，本地地址，本地端口号）
这样一个三元组，叫做一个半相关（half-association），它指定连接的每半部分。
全相关
一个完整的网间进程通信需要由两个进程组成，并且只能使用同一种高层协议。也就是说，不可能通信的一端用TCP协议，而另一端用UDP协议。因此一个完整的网间通信需要一个五元组来标识：
（协议，本地地址，本地端口号，远地地址，远地端口号）
这样一个五元组，叫做一个相关（association），即两个协议相同的半相关才能组合成一个合适的相关，或完全指定组成一连接。

在网络分层结构中，各层之间是严格单向依赖的，各层次的分工和协作集中体现在相邻层之间的界面上。"服务"是描述相邻层之间关系的抽象概念，即网络中各层向紧邻上层提供的一组操作。下层是服务提供者，上层是请求服务的用户。服务的表现形式是原语（primitive），如系统调用或库函数。系统调用是操作系统内核向网络应用程序或高层协议提供的服务原语。网络中的n层总要向n+1层提供比n-1层更完备的服务，否则n层就没有存在的价值。
在OSI的术语中，网络层及其以下各层又称为通信子网，只提供点到点通信，没有程序或进程的概念。而传输层实现的是"端到端"通信，引进网间进程通信概念，同时也要解决差错控制，流量控制，数据排序（报文排序），连接管理等问题，为此提供不同的服务方式：
面向连接（虚电路）或无连接
面向连接服务是电话系统服务模式的抽象，即每一次完整的数据传输都要经过建立连接，使用连接，终止连接的过程。在数据传输过程中，各数据分组不携带目的地址，而使用连接号（connect ID）。本质上，连接是一个管道，收发数据不但顺序一致，而且内容相同。TCP协议提供面向连接的虚电路。
无连接服务是邮政系统服务的抽象，每个分组都携带完整的目的地址，各分组在系统中独立传送。无连接服务不能保证分组的先后顺序，不进行分组出错的恢复与重传，不保证传输的可靠性。UDP协议提供无连接的数据报服务。
下面给出这两种服务的类型及应用中的例子：
服务类型
服务
例子
面向连接
可靠的报文流
可靠的字节流
不可靠的连接
文件传输（FTP）
远程登录（Telnet）
数字话音
无连接
不可靠的数据报
有确认的数据报
请求－应答
电子邮件（E-mail）
电子邮件中的挂号信
网络数据库查询
顺序
在网络传输中，两个连续报文在端－端通信中可能经过不同路径，这样到达目的地时的顺序可能会与发送时不同。"顺序"是指接收数据顺序与发送数据顺序相同。TCP协议提供这项服务。
差错控制
保证应用程序接收的数据无差错的一种机制。检查差错的方法一般是采用检验"检查和（Checksum）"的方法。而保证传送无差错的方法是双方采用确认应答技术。TCP协议提供这项服务。
流控制
在数据传输过程中控制数据传输速率的一种机制，以保证数据不被丢失。TCP协议提供这项服务。
字节流
字节流方式指的是仅把传输中的报文看作是一个字节序列，不提供数据流的任何边界。TCP协议提供字节流服务。
报文
接收方要保存发送方的报文边界。UDP协议提供报文服务。
全双工/半双工
端－端间数据同时以两个方向/一个方向传送。
缓存/带外数据
在字节流服务中，由于没有报文边界，用户进程在某一时刻可以读或写任意数量的字节。为保证传输正确或采用有流控制的协议时，都要进行缓存。但对某些特殊的需求，如交互式应用程序，又会要求取消这种缓存。
在数据传送过程中，希望不通过常规传输方式传送给用户以便及时处理的某一类信息，如UNIX系统的中断键（Delete或Control-c）、终端流控制符（Control-s和Control-q），称为带外数据。逻辑上看，好象用户进程使用了一个独立的通道传输这些数据。该通道与每对连接的流相联系。由于Berkeley Software Distribution中对带外数据的实现与RFC 1122中规定的Host Agreement不一致,为了将互操作中的问题减到最小，应用程序编写者除非与现有服务互操作时要求带外数据外，最好不使用它。
2.2.3 客户/服务器模式
在TCP/IP 网络应用中，通信的两个进程间相互作用的主要模式是客户/服务器模式（Client/Server model），即客户向服务器发出服务请求，服务器接收到请求后，提供相应的服务。客户/服务器模式的建立基于以下两点：首先，建立网络的起因是网络中软硬件资源、运算能力和信息不均等，需要共享，从而造就拥有众多资源的主机提供服务，资源较少的客户请求服务这一非对等作用。其次，网间进程通信完全是异步的，相互通信的进程间既不存在父子关系，又不共享内存缓冲区，因此需要一种机制为希望通信的进程间建立联系，为二者的数据交换提供同步，这就是基于客户/ 服务器模式的TCP/IP。
客户/服务器模式在操作过程中采取的是主动请求方式：
首先服务器方要先启动，并根据请求提供相应服务：
1. 打开一通信通道并告知本地主机，它愿意在某一公认地址上（周知口，如FTP为21）接收客户请求；
2. 等待客户请求到达该端口；
3. 接收到重复服务请求，处理该请求并发送应答信号。接收到并发服务请求，要激活一新进程来处理这个客户请求（如UNIX系统中用fork、exec）。新进程处理此客户请求，并不需要对其它请求作出应答。服务完成后，关闭此新进程与客户的通信链路，并终止。
4. 返回第二步，等待另一客户请求。
5. 关闭服务器
客户方：
1. 打开一通信通道，并连接到服务器所在主机的特定端口；
2. 向服务器发服务请求报文，等待并接收应答；继续提出请求......
3. 请求结束后关闭通信通道并终止。
从上面所描述过程可知：
1. 客户与服务器进程的作用是非对称的，因此编码不同。
2. 服务进程一般是先于客户请求而启动的。只要系统运行，该服务进程一直存在，直到正常或强迫终止。
2.2.4 套接字类型
TCP/IP的socket提供下列三种类型套接字。
流式套接字（SOCK_STREAM）
提供了一个面向连接、可靠的数据传输服务，数据无差错、无重复地发送，且按发送顺序接收。内设流量控制，避免数据流超限；数据被看作是字节流，无长度限制。文件传送协议（FTP）即使用流式套接字。
数据报式套接字（SOCK_DGRAM）
提供了一个无连接服务。数据包以独立包形式被发送，不提供无错保证，数据可能丢失或重复，并且接收顺序混乱。网络文件系统（NFS）使用数据报式套接字。
原始式套接字（SOCK_RAW）
该接口允许对较低层协议，如IP、ICMP直接访问。常用于检验新的协议实现或访问现有服务中配置的新设备。
2.3 基本套接字系统调用
为了更好地说明套接字编程原理，下面给出几个基本套接字系统调用说明。
2.3.1 创建套接字──socket()
应用程序在使用套接字前，首先必须拥有一个套接字，系统调用socket()向应用程序提供创建套接字的手段，其调用格式如下：
SOCKET PASCAL FAR socket(int af, int type, int protocol);
该调用要接收三个参数：af、type、protocol。参数af指定通信发生的区域，UNIX系统支持的地址族有：AF_UNIX、AF_INET、 AF_NS等，而DOS、WINDOWS中仅支持AF_INET，它是网际网区域。因此，地址族与协议族相同。参数type 描述要建立的套接字的类型。参数protocol说明该套接字使用的特定协议，如果调用者不希望特别指定使用的协议，则置为0，使用默认的连接模式。根据这三个参数建立一个套接字，并将相应的资源分配给它，同时返回一个整型套接字号。因此，socket()系统调用实际上指定了相关五元组中的"协议"这一元。
1.2.4 实例—Willsock实现基于TCP的客户端/服务器通信

C/S模式
客户机/服务器模式的建立基于以下两点：首先，建立网络的起因是网络中软硬件资源、运算能力和信息不均等，需要共享，从而造就拥有众多资源的主机提供服务，资源较少的客户请求服务这一非对等作用。其次，网间进程通信完全是异步的，相互通信的进程间既不存在父子关系，又不共享内存缓冲区，因此需要一种机制为希望通信的进程间建立联系，为二者的数据交换提供同步，这就是基于客户机/服务器模式的TCP/IP。

客户机/服务器模式在操作过程中采取的是主动请求的方式。

基于TCP(面向连接)的socket编程

服务端进程通过bind方法将其套接字告知系统，以使其他的套接字能找到它。它可通过套接字的“侦听(listen)”来“接收(accept)”发过来的信息。客户端的进程同服务端套接字建立连接然后交换信息。需要的信息都可以从该通道向任一端进行发送。

面向连接的TCP通信过程如下：

服务器：

创建端点 (socket())

绑定地址(bind())

指定队列(listen())

等待连接 (accept())

传输数据 (read()/write())

客户端：

创建端点 (socket())

链接服务器 (connect())

传输数据(read()/write())

基于UDP(面向无连接)的socket编程

用无连接协议，双方的套接字都需要用bind方法来告知系统。这是因为每方的信息都会单独处理，所以每次服务端发信息过来时，客户端都需要找到它，反之亦然。每次调用bind方法，都绑定了一个新的端口。当然，如果端口已经被使用了，则是不能被绑定的。如果你指定的端口为0，则系统会把当前可用的端口自动给你一个。由于发送信息的额外任务，进程不会使用read/write方法，而是使用recvfrom/sendto方法。这两个方法的参数一个是要写入的套接字，另一个则是远程计算机上服务的地址。

服务端：

创建端点(socket())

绑定地址 (bind())

传输数据(sendto()/recvfrom())

客户端：

创建端点 (socket())

绑定地址(bind()) (connect方法可选择调用)

连接服务端(connect())

传输数据(sendto()/recvfrom())

多线程的设计

《VC中利用多线程技术实现线程之间的通信》这篇文章比较适合线程的了解，Win32 提供了一系列的API函数来完成线程的创建、挂起、恢复、终结以及通信等工作。MFC中使用线程要注意：

1、尽量少的使用全局变量、static变量做共享数据，尽量使用参数传递对象。

2、在MFC中请慎用线程。因为MFC的框架假定你的消息处理都是在主线程中完成的。首先窗口句柄是属于线程的，如果拥有窗口句柄的线程退出了，如果另一个线程处理这个窗口句柄，系统就会出现问题。而MFC为了避免这种情况的发生，使你在子线程中调用消息（窗口）处理函数时，就会不停的出Assert错误，烦都烦死你。典型的例子就时CSocket，因为CSocket是使用了一个隐藏窗口实现了假阻塞，所以不可避免的使用了消息处理函数，如果你在子线程中使用CSocket，你就可能看到assert的弹出了。

3、不要在不同的线程中同时注册COM组件。

常见问题的解决

1、关闭套接字

我们在利用IOCP（完成端口）进行程序设计的时候，经常要关闭一些不满足条件的套接字。假如我们直接采用closesocket方法进行关闭的话，绑定到IO端口的此套接字的未发送的数据就会丢失，这种情况是我们不愿意发生的。下面介绍一种合理关闭此套接字的方法:
　　首先，利用setsockopt（MSDN）函数设定套接字的选项，我们把此套接字设定为：假如有数据未发送，当数据发送完后再关闭此套接字。
　　代码如下：
LINGER lingerStruct;
lingerStruct.l_onoff = 1;
lingerStruct.l_linger = 0;
setsockopt(Socket, SOL_SOCKET, SO_LINGER,
(char *)&lingerStruct, sizeof(lingerStruct) );
// Now close the socket handle. This will do an abortive or graceful close, as requested.
CancelIo((HANDLE) Socket);
closesocket(Socket);
clientSocket = INVALID_SOCKET;
　　当在完成端口的数据被发送出去之后，套接字就会被关闭，这样我们就完成了一个套接字的关闭。

<参考 http://www.examda.com/ncre2/cpp/fudao/20090107/091252332.html>

2、解决 Socket API错误代码：WSAECONNRESET (10054)

出现原因：使用UDP SOCKET时（利用事件触发方式），如果发送端在发送数据时（WSASendTo），接收端没还有创建，那么发送端将会收到一个事件通知，此时调用WSARecv()函数时将会产生调用错误（WSAECONNRESET )，从这以后，这个发送端这个SOCKET无法接受到数据。解决办法:

         a.头文件中加入下面代码：
               #include <Winsock2.h>
               #pragma comment(lib,"ws2_32.lib")
               #define IOC_VENDOR 0x18000000
               #define _WSAIOW(x,y) (IOC_IN|(x)|(y))
               #define SIO_UDP_CONNRESET _WSAIOW(IOC_VENDOR,12)
         b.在创建socket之后加入下面代码：
               DWORD    dwBytesReturned = 0;
               BOOL        bNewBehavior = FALSE;
               DWORD    status;
               status = WSAIoctl(m_hSock, SIO_UDP_CONNRESET,
                           &bNewBehavior,
                           sizeof (bNewBehavior),
                           NULL, 0, &dwBytesReturned,
                           NULL, NULL);
      <参考 http://blog.csdn.net/wupangzi/archive/2009/07/27/4384081.aspx及http://hi.baidu.com/jetqu2003/blog/item/397700031435e9703812bbcc.html>

1.3　利用MFC网络编程
1.3.1 CAsyncSocket类的基本组成
1.3.2 CSocket类的基本组成
1.3.3 Winlnet类的基本组成
1.3.4 实例——基于CSocket的网络聊天室
第2章　认识Windows编程模型
2.1 Windows初级编程模型
2.1.1　匈牙利命名法
2.1.2 Visual C++使用入门
2.1.3　最简单的Windows应用程序
2.2 Windows应用程序剖析
2.2.1　真正的Windows应用程序
2.2.2 Windows程序分析
2.2.3　重要的消息事件处理
2.2.4 Windows控件的应用
2.3 Windows高级编程
2.3.1　利用Windows菜单中的位图资源
2.3.2　利用资源制作菜单
2.4　小结
第3章　网络基本应用在VC++中的实现
3.1　获取网卡的MAC地址
3.1.1　原理
3.1.2　实现程序
3.2　获取网络中计算机的IP地址和计算机名

深入DNS域名解析服务原理

DNS分为Client和Server，Client扮演发问的角色，也就是问Server一个Domain Name，而Server必须要回答此Domain Name的真正IP地址。而当地的DNS先会查自己的资料库。如果自己的资料库没有，则会往该DNS上所设的的DNS询问，依此得到答案之后，将收到的答案存起来，并回答客户。

DNS服务器会根据不同的授权区(Zone)，记录所属该网域下的各名称资料，这个资料包括网域下的次网域名称及主机名称。

　　在每一个名称服务器中都有一个快取缓存区(Cache)，这个快取缓存区的主要目的是将该名称服务器所查询出来的名称及相对的IP地址记录在快取缓存区中，这样当下一次还有另外一个客户端到次服务器上去查询相同的名称时，服务器就不用在到别台主机上去寻找，而直接可以从缓存区中找到该笔名称记录资料，传回给客户端，加速客户端对名称查询的速度。例如:

　　当DNS客户端向指定的DNS服务器查询网际网路上的某一台主机名称 DNS服务器会在该资料库中找寻用户所指定的名称如果没有，该服务器会先在自己的快取缓存区中查询有无该笔纪录，如果找到该笔名称记录后，会从DNS服务器直接将所对应到的IP地址传回给客户端，如果名称服务器在资料记录查不到且快取缓存区中也没有时，服务器首先会才会向别的名称服务器查询所要的名称。例如:

DNS客户端向指定的DNS服务器查询网际网路上某台主机名称，当DNS服务器在该资料记录找不到用户所指定的名称时，会转向该服务器的快取缓存区找寻是否有该资料，当快取缓存区也找不到时，会向最接近的名称服务器去要求帮忙找寻该名称的IP地址，在另一台服务器上也有相同的动作的查询，当查询到后会回复原本要求查询的服务器，该DNS服务器在接收到另一台DNS服务器查询的结果后，先将所查询到的主机名称及对应IP地址记录到快取缓存区中，最后在将所查询到的结果回复给客户端。

　　范例

　　我们举例说明，假设我们要查询网际网路上的一个名称为www.test.com.cn，从此名称我们知道此部主机在中国CN，而且要找的组织名称test.com.cn此网域下的www主机，以下为名称解析过程的每一步骤。

　　《Step 1》在DNS的客户端(Reslover)键入查询主机的指令，如:

c:\ping www.test.com.cn

pinging www.test.com.cn 【192.72.80.36】with 32bytes of data

reply from 192.72.80.36 bytes time <10ms ttl 253

　　《Step 2》而被指定的DNS服务器先行查询是否属于该网域下的主机名称，如果查出改主机名称并不属于该网域范围，之后会再查询快取缓存区的纪录资料，查是否有此机名称。

　　《Step 3》查询后发现缓存区中没有此纪录资料，会取得一台根网域的其中一台服务器，发出说要找www.test.com.cn的Request。

　　《Step 4》在根网域中，向Root Name Server询问，Root Name Server记录了各Top Domain分别是由哪些DNS Server负责，所以他会响应最接近的Name Server为控制CN网域的DNS伺服主机。

　　《Step 5》Root Name Server已告诉Local DNS Server哪部Name Server负责.cn这个Domain，然后Local DNS再向负责发出找寻www.test.com.cn的名称Request。

　　《Step 6》在.cn这个网域中，被指定的DNS服务器在本机上没有找到此名称的的纪录，所以会响应原本发出查询要求的DNS服务器说最近的服务器在哪里?他会回应最近的主机为控制com.cn网域的DNS伺服主机。

　　《Step 7》原本被查询的DNS服务器主机，收到继续查询的IP位置后，会再向com.cn的网域的DNS Server发出寻找www.test.com.cn名称搜寻的要求。

　　《Step 8》com.cn的网域中，被指定的DNS Server在本机上没有找到此名称的记录，所以会回复查询要求的DNS Server告诉他最接近的服务器在哪里?他就回应最接近为控制test.com.cn的网域的DNS主机。

　　《Step 9》原本被查询的DNS Server，在接收到应继续查询的位置，在向test.com.cn网域的DNS Server发出寻找www.test.com.cn的要求，最后会在test.com.cn的网域的DNS Server找到www.test.com.cn此主机的IP。

　　《Step 10》所以原本发出查询要求的DNS服务器，再接收到查询结果的IP位置后，响应回给原查询名称的DNS客户端。

　　两种真正DNS的查询模式

　　有两种询问原理，分为Recursive和Interactive两种。前者是由DNS代理去问，问的方法是用Interactive方式，后者是由本机直接做Interactive式的询问。由上例可以看出，我们一般查询名称的过程中，实际上这两种查询模式都是交互存在着的。

　　递归式(Recursive):DNS客户端向DNS Server的查询模式，这种方式是将要查询的封包送出去问，就等待正确名称的正确响应，这种方式只处理响应回来的封包是否是正确响应或是说是找不到该名称的错误讯息。

　　交谈式(Interactive):DNS Server间的查询模式，由Client端或是DNS Server上所发出去问，这种方式送封包出去问，所响应回来的资料不一定是最后正确的名称位置，但也不是如上所说的响应回来是错误讯息，他响应回来告诉你最接近的IP位置，然后再到此最接近的IP上去寻找所要解析的名称，反复动作直到找到正确位置。

3.2.1　原理
3.2.2　实现程序
3.3　超链接程序的原理与实现
3.3.1　原理
3.3.2　实现程序

超级链接程序原理与实现MFC网络编程 2010-12-21 21:02:49 阅读评论字号：大中小订阅 .

(一)原理：要实现超级链接程序，首先创建一个CHyperLink类，而该类是从静态文本框类Static继承而来的，因此具备了CStatic的所有属性，同时在该类的基础上，扩展一些功能，比如设定颜色、设定鼠标形状等，然后通过对操作函数的调用链接到相应的URL

(二)类声明部分的代码：

class CHyperLink : public CStatic

{

// Construction

public:

CHyperLink();

// Attributes

public:

// Operations

public:

void SetURL(CString strURL);//设定URL

CString GetURL()const;//获得URL

void SetColours(COLORREF crLinkColour,COLORREF crVisitedColour,COLORREF crHoverColour=-1);//设定颜色

COLORREF GetLinkColour()const;//获得连接颜色

COLORREF GetVisitedColour() const;//获得被访问后的颜色

COLORREF GetHoverColour()const;//获得鼠标移动上以后的颜色

void SetVisited(BOOL bVisited=TRUE);//设定是否被访问过

BOOL GetVisited()const;//获得是否被访问过

void SetLinkCursor(HCURSOR hCursor);//设定鼠标形状

HCURSOR GetLinkCursor()const;//获得鼠标形状

void SetUnderline(BOOL bUnderline=TRUE);//设定是否有下划线

BOOL GetUnderline()const;//获得是否有下划线

void SetAutoSize(BOOL bAutoSize=TRUE);//设定是否是自动改变大小

BOOL GetAutoSize() const;

// Overrides

// ClassWizard generated virtual function overrides

//{{AFX_VIRTUAL(CHyperLink)

public:

virtual BOOL PreTranslateMessage(MSG* pMsg);

protected:

virtual void PreSubclassWindow();

//}}AFX_VIRTUAL

// Implementation

public:

virtual ~CHyperLink();

protected:

HINSTANCE GotoURL(LPCTSTR url,int showcmd);//连接到URL

void ReportError(int nError);//打印错误

LONG GetRegKey(HKEY key,LPCTSTR subkey,LPTSTR retdata);//获得注册表信息

void PositionWindow();//调整位置

void SetDefaultCursor();//设定默认的鼠标形状

protected:

COLORREF m_crLinkColour,m_crVisitedColour; //超级链接颜色

COLORREF m_crHoverColour;//鼠标停留颜色

BOOL m_bOverControl;//是否鼠标移到控件上

BOOL m_bVisited;//是否被访问

BOOL m_bUnderline;//是否有下画线

BOOL m_bAdjustToFit;//是否自动调整控件大小

CString m_strURL;//URL

CFont m_Font;//设定字体

HCURSOR m_hLinkCursor;//光标

CToolTipCtrl m_ToolTip;//提示文字

// Generated message map functions

//{{AFX_MSG(CHyperLink)

afx_msg HBRUSH OnCtlColor(CDC* pDC, CWnd* pWnd, UINT nCtlColor);

afx_msg void OnMouseMove(UINT nFlags, CPoint point);

afx_msg BOOL OnSetCursor(CWnd* pWnd, UINT nHitTest, UINT message);

afx_msg void OnClicked();

afx_msg HBRUSH CtlColor(CDC* pDC, UINT nCtlColor);

//}}AFX_MSG

DECLARE_MESSAGE_MAP()

};

(三)类实现部分的代码:

BOOL CHyperLink::PreTranslateMessage(MSG* pMsg) //重载该函数，可以处理键盘和鼠标消息

{

// TODO: Add your specialized code here and/or call the base class

m_ToolTip.RelayEvent(pMsg);

return CStatic::PreTranslateMessage(pMsg);

}

void CHyperLink::PreSubclassWindow() //定制控件

{

// 获得鼠标单击事件

DWORD dwStyle = GetStyle();

::SetWindowLong(GetSafeHwnd(), GWL_STYLE, dwStyle | SS_NOTIFY);

// 如果URL为空，设定为窗体名称

if (m_strURL.IsEmpty())

GetWindowText(m_strURL);

// 同时检查窗体标题是否为空，如果为空则设定为URL

CString strWndText;

GetWindowText(strWndText);

if (strWndText.IsEmpty()) {

ASSERT(!m_strURL.IsEmpty());

SetWindowText(m_strURL);

}

// 创建字体

LOGFONT lf;

GetFont()->GetLogFont(&lf);

lf.lfUnderline = m_bUnderline;

m_Font.CreateFontIndirect(&lf);

SetFont(&m_Font);

PositionWindow(); // 调整窗体大小

SetDefaultCursor(); // 设定默认鼠标形状

//创建提示信息

CRect rect;

GetClientRect(rect);

m_ToolTip.Create(this);

m_ToolTip.AddTool(this, m_strURL, rect, TOOLTIP_ID);

CStatic::PreSubclassWindow();

}

HBRUSH CHyperLink::OnCtlColor(CDC* pDC, CWnd* pWnd, UINT nCtlColor)

{

HBRUSH hbr = CStatic::OnCtlColor(pDC, pWnd, nCtlColor);

// TODO: Change any attributes of the DC here

// TODO: Return a different brush if the default is not desired

return hbr;

}

void CHyperLink::OnMouseMove(UINT nFlags, CPoint point) //鼠标移动事件

{

// TODO: Add your message handler code here and/or call default

CStatic::OnMouseMove(nFlags, point);

if(m_bOverControl) //判断是否鼠标在控件上方

{

CRect rect;

GetClientRect(rect);

if(!rect.PtInRect(point))

{

m_bOverControl=FALSE;

ReleaseCapture();

RedrawWindow();

return;

}

else

{

m_bOverControl=TRUE;

RedrawWindow();

SetCapture();

}

BOOL CHyperLink::OnSetCursor(CWnd* pWnd, UINT nHitTest, UINT message)

{

// TODO: Add your message handler code here and/or call default

if (m_hLinkCursor)

{

::SetCursor(m_hLinkCursor);

return TRUE;

}

return FALSE;

}

void CHyperLink::OnClicked()

{

int result = (int)GotoURL(m_strURL, SW_SHOW);

m_bVisited = (result > HINSTANCE_ERROR);

if (!m_bVisited) {

MessageBeep(MB_ICONEXCLAMATION); // Unable to follow link

ReportError(result);

} else

SetVisited(); // Repaint to show visited colour

}

void CHyperLink::PositionWindow()//调整窗口位置事件

{

if(!::IsWindow(GetSafeHwnd()) || m_bAdjustToFit)

return ;

CRect rect;//得到当前窗口的位置

GetWindowRect(rect);

CWnd* pParent=GetParent();

if(pParent)

pParent->ScreenToClient(rect);

CString strWndText; //得到窗口文本的大小

GetWindowText(strWndText);

CDC* pDC=GetDC();

CFont* pOldFont=pDC->SelectObject(&m_Font);

CSize Extent=pDC->GetTextExtent(strWndText);

pDC->SelectObject(pOldFont);

ReleaseDC(pDC);

DWORD dwStyle=GetStyle();//通过窗口的风格获得文本的环境

if(dwStyle & SS_CENTERIMAGE)

rect.DeflateRect(0,(rect.Height()-Extent.cy)/2);

else

rect.bottom=rect.top+Extent.cy;

if(dwStyle & SS_CENTER)

rect.DeflateRect((rect.Width()-Extent.cx)/2,0);

else if(dwStyle & SS_RIGHT)

rect.left=rect.right-Extent.cx;

else

rect.right=rect.left+Extent.cx;

SetWindowPos(NULL,rect.left,rect.top,rect.Width(),rect.Height(),SWP_NOZORDER);

}

//链接到目标地址

HINSTANCE CHyperLink::GotoURL(LPCTSTR url, int showcmd)

{

TCHAR key[MAX_PATH + MAX_PATH];

// 调用函数ShellExecute()

HINSTANCE result = ShellExecute(NULL, _T("open"), url, NULL,NULL, showcmd);

// 如果错误，则检查注册表获得.htm文件的注册键值

if ((UINT)result <= HINSTANCE_ERROR) {

if (GetRegKey(HKEY_CLASSES_ROOT, _T(".htm"), key) == ERROR_SUCCESS) {

lstrcat(key, _T("\\shell\\open\\command"));

if (GetRegKey(HKEY_CLASSES_ROOT,key,key) == ERROR_SUCCESS) {

TCHAR *pos;

pos = _tcsstr(key, _T("\"%1\""));

if (pos == NULL) { // 没有发现

pos = strstr(key, _T("%1")); // 检查%1

if (pos == NULL) // 没有参数

pos = key+lstrlen(key)-1;

else

*pos = '\0'; // 删除参数

}

else

*pos = '\0'; // 删除参数

lstrcat(pos, _T(" "));

lstrcat(pos, url);

result = (HINSTANCE) WinExec(key,showcmd);

}

return result;

}

HBRUSH CHyperLink::CtlColor(CDC* pDC, UINT nCtlColor)

{

ASSERT(nCtlColor == CTLCOLOR_STATIC);

if (m_bOverControl)

pDC->SetTextColor(m_crHoverColour);

else if (m_bVisited)

pDC->SetTextColor(m_crVisitedColour);

else

pDC->SetTextColor(m_crLinkColour);

// transparent text.

pDC->SetBkMode(TRANSPARENT);

return (HBRUSH)GetStockObject(NULL_BRUSH);

}

BOOL CHyperLink::GetAutoSize() const

{

return m_bAdjustToFit;

}

COLORREF CHyperLink::GetHoverColour() const//获得鼠标移动上以后的颜色

{

return m_crHoverColour;

}

COLORREF CHyperLink::GetLinkColour() const//获得连接颜色

{

return m_crLinkColour;

}

HCURSOR CHyperLink::GetLinkCursor() const//获得鼠标形状

{

return m_hLinkCursor;

}

LONG CHyperLink::GetRegKey(HKEY key, LPCTSTR subkey, LPTSTR retdata)//获得注册表信息

{

HKEY hkey;

LONG retval = RegOpenKeyEx(key, subkey, 0, KEY_QUERY_VALUE, &hkey);

if (retval == ERROR_SUCCESS) {

long datasize = MAX_PATH;

TCHAR data[MAX_PATH];

RegQueryValue(hkey, NULL, data, &datasize);

lstrcpy(retdata,data);

RegCloseKey(hkey);

}

return retval;

}

BOOL CHyperLink::GetUnderline() const//获得是否有下划线

{

return m_bUnderline;

}

CString CHyperLink::GetURL() const//获得URL

{

return m_strURL;

}

BOOL CHyperLink::GetVisited() const//获得是否被访问过

{

return m_bVisited;

}

COLORREF CHyperLink::GetVisitedColour() const//获得被访问后的颜色

{

return m_crVisitedColour;

}

void CHyperLink::ReportError(int nError)//打印错误

{

CString str;

switch (nError) {

case 0: str = "The operating system is out\nof memory or resources."; break;

case SE_ERR_PNF: str = "The specified path was not found."; break;

case SE_ERR_FNF: str = "The specified file was not found."; break;

case ERROR_BAD_FORMAT: str = "The .EXE file is invalid\n(non-Win32 .EXE or error in .EXE image)."; break;

case SE_ERR_ACCESSDENIED: str = "The operating system denied\naccess to the specified file."; break;

case SE_ERR_ASSOCINCOMPLETE: str = "The filename association is\nincomplete or invalid."; break;

case SE_ERR_DDEBUSY: str = "The DDE transaction could not\nbe completed because other DDE transactions\nwere being processed."; break;

case SE_ERR_DDEFAIL: str = "The DDE transaction failed."; break;

case SE_ERR_DDETIMEOUT: str = "The DDE transaction could not\nbe completed because the request timed out."; break;

case SE_ERR_DLLNOTFOUND: str = "The specified dynamic-link library was not found."; break;

case SE_ERR_NOASSOC: str = "There is no application associated\nwith the given filename extension."; break;

case SE_ERR_OOM: str = "There was not enough memory to complete the operation."; break;

case SE_ERR_SHARE: str = "A sharing violation occurred. ";

default: str.Format("Unknown Error (%d) occurred.", nError); break;

}

str = "Unable to open hyperlink:\n\n" + str;

AfxMessageBox(str, MB_ICONEXCLAMATION | MB_OK);

}

void CHyperLink::SetAutoSize(BOOL bAutoSize /* = TRUE */)//设定是否自动改变大小

{

m_bAdjustToFit = bAutoSize;

if (::IsWindow(GetSafeHwnd()))

PositionWindow();

}

//设定颜色

void CHyperLink::SetColours(COLORREF crLinkColour, COLORREF crVisitedColour,

COLORREF crHoverColour /* = -1 */)

{

m_crLinkColour = crLinkColour;

m_crVisitedColour = crVisitedColour;

if (crHoverColour == -1)

m_crHoverColour = ::GetSysColor(COLOR_HIGHLIGHT);

else

m_crHoverColour = crHoverColour;

if (::IsWindow(m_hWnd))

Invalidate();

}

void CHyperLink::SetDefaultCursor()//设定默认的鼠标形状

{

if (m_hLinkCursor == NULL) // No cursor handle - load our own

{

// Get the windows directory

CString strWndDir;

GetWindowsDirectory(strWndDir.GetBuffer(MAX_PATH), MAX_PATH);

strWndDir.ReleaseBuffer();

strWndDir += _T("\\winhlp32.exe");

// This retrieves cursor #106 from winhlp32.exe, which is a hand pointer

HMODULE hModule = LoadLibrary(strWndDir);

if (hModule) {

HCURSOR hHandCursor = ::LoadCursor(hModule, MAKEINTRESOURCE(106));

if (hHandCursor)

m_hLinkCursor = CopyCursor(hHandCursor);

}

FreeLibrary(hModule);

}

void CHyperLink::SetLinkCursor(HCURSOR hCursor)//设定鼠标形状

{

m_hLinkCursor = hCursor;

if (m_hLinkCursor == NULL)

SetDefaultCursor();

}

//设置下划线

void CHyperLink::SetUnderline(BOOL bUnderline /* = TRUE */)

{

m_bUnderline = bUnderline;

if (::IsWindow(GetSafeHwnd()))

{

LOGFONT lf;

GetFont()->GetLogFont(&lf);

lf.lfUnderline = m_bUnderline;

m_Font.DeleteObject();

m_Font.CreateFontIndirect(&lf);

SetFont(&m_Font);

Invalidate();

}

//设定URL

void CHyperLink::SetURL(CString strURL)

{

m_strURL = strURL;

if (::IsWindow(GetSafeHwnd())) {

PositionWindow();

m_ToolTip.UpdateTipText(strURL, this, TOOLTIP_ID);

}

void CHyperLink::SetVisited(BOOL bVisited /* = TRUE */) //设定是否被访问过

{

m_bVisited = bVisited;

if (::IsWindow(GetSafeHwnd()))

Invalidate();

}

3.4　获取域名和网卡类型的原理和实现
3.4.1　原理
3.4.2　实现程序
3.5 小结
第4章串口通信及其实例
4.1 串行通信原理
4.1.1 串行通信基本概念
4.1.2　单工、半双工和全双工定义
4.1.3 串行通信协议
4.1.4　串行通信方式
4.2 MSComm控件
4.2.1 VC++中的MSComm控件
4.2.2 实例——-MSCscorIlIn多串口通信
4.3 Windows APl串口通信编程
4.3.1 Windows串口通信API函数
4.3.2 VC++中的CserialPort类
4.3.3 实例——串口的多线程通信
4.4小结
第5章　应用层协议及编程实例
5.1　应用层协议体系结构
5.1.1　应用层协议原理
5.1.2 网络应用程序的体系结构
5.2 HTTP协议
5.2.1 HTTP协议

http协议的主要特点

HTTP协议的主要特点可概括如下：

1.支持客户/服务器模式。

2.简单快速：客户向服务器请求服务时，只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单，使得HTTP服务器的程序规模小，因而通信速度很快。

3.灵活：HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type（Content-Type是HTTP包中用来表示内容类型的标识）加以标记。

4.无连接：无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求，并收到客户的应答后，即断开连接。采用这种方式可以节省传输时间。

5.无状态：HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息，则它必须重传，这样可能导致每次连接传送的数据量增大。另一方面，在服务器不需要先前信息时它的应答就较快。

1.连接(Connection)：一个传输层的实际环流，它是建立在两个相互通讯的应用程序之间。　　2.消息(Message)：HTTP通讯的基本单位，包括一个结构化的八元组序列并通过连接传输。　　3.请求(Request)：一个从客户端到服务器的请求信息包括应用于资源的方法、资源的标

HTTP协议的几个重要概念

1.连接(Connection)：一个传输层的实际环流，它是建立在两个相互通讯的应用程序之间。
2.消息(Message)：HTTP通讯的基本单位，包括一个结构化的八元组序列并通过连接传输。
3.请求(Request)：一个从客户端到服务器的请求信息包括应用于资源的方法、资源的标识符和协议的版本号
4.响应(Response)：一个从服务器返回的信息包括HTTP协议的版本号、请求的状态(例如“成功”或“没找到”)和文档的MIME类型。
5.资源(Resource)：由URI标识的网络数据对象或服务。
6.实体(Entity)：数据资源或来自服务资源的回映的一种特殊表示方法，它可能被包围在一个请求或响应信息中。一个实体包括实体头信息和实体的本身内容。
7.客户机(Client)：一个为发送请求目的而建立连接的应用程序。
8.用户代理(Useragent)：初始化一个请求的客户机。它们是浏览器、编辑器或其它用户工具。
9.服务器(Server)：一个接受连接并对请求返回信息的应用程序。
10.源服务器(Originserver)：是一个给定资源可以在其上驻留或被创建的服务器。
11.代理(Proxy)：一个中间程序，它可以充当一个服务器，也可以充当一个客户机，为其它客户机建立请求。请求是通过可能的翻译在内部或经过传递到其它的服务器中。一个代理在发送请求信息之前，必须解释并且如果可能重写它。
　　代理经常作为通过防火墙的客户机端的门户，代理还可以作为一个帮助应用来通过协议处理没有被用户代理完成的请求。
12.网关(Gateway)：一个作为其它服务器中间媒介的服务器。与代理不同的是，网关接受请求就好象对被请求的资源来说它就是源服务器；发出请求的客户机并没有意识到它在同网关打交道。
　　网关经常作为通过防火墙的服务器端的门户，网关还可以作为一个协议翻译器以便存取那些存储在非HTTP系统中的资源。
13.通道(Tunnel)：是作为两个连接中继的中介程序。一旦激活，通道便被认为不属于HTTP通讯，尽管通道可能是被一个HTTP请求初始化的。当被中继的连接两端关闭时，通道便消失。当一个门户(Portal)必须存在或中介(Intermediary)不能解释中继的通讯时通道被经常使用。
14.缓存(Cache)：反应信息的局域存储。

HTTP协议基础

HTTP（HyperTextTransferProtocol）是超文本传输协议的缩写，它用于传送WWW方式的数据，关于HTTP协议的详细内容请参考RFC2616。HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求，请求头包含请求的方法、URI、协议版本、以及包含请求修饰符、客户信息和内容的类似于MIME的消息结构。服务器以一个状态行作为响应，相应的内容包括消息协议的版本，成功或者错误编码加上包含服务器信息、实体元信息以及可能的实体内容。
通常HTTP消息包括客户机向服务器的请求消息和服务器向客户机的响应消息。这两种类型的消息由一个起始行，一个或者多个头域，一个只是头域结束的空行和可选的消息体组成。HTTP的头域包括通用头，请求头，响应头和实体头四个部分。每个头域由一个域名，冒号（:）和域值三部分组成。域名是大小写无关的，域值前可以添加任何数量的空格符，头域可以被扩展为多行，在每行开始处，使用至少一个空格或制表符。
通用头域
通用头域包含请求和响应消息都支持的头域，通用头域包含Cache-Control、Connection、Date、Pragma、Transfer-Encoding、Upgrade、Via。对通用头域的扩展要求通讯双方都支持此扩展，如果存在不支持的通用头域，一般将会作为实体头域处理。下面简单介绍几个在UPnP消息中使用的通用头域。
Cache-Control头域
Cache-Control指定请求和响应遵循的缓存机制。在请求消息或响应消息中设置Cache-Control并不会修改另一个消息处理过程中的缓存处理过程。请求时的缓存指令包括no-cache、no-store、max-age、max-stale、min-fresh、only-if-cached，响应消息中的指令包括public、private、no-cache、no-store、no-transform、must-revalidate、proxy-revalidate、max-age。各个消息中的指令含义如下：
Public指示响应可被任何缓存区缓存。
Private指示对于单个用户的整个或部分响应消息，不能被共享缓存处理。这允许服务器仅仅描述当用户的部分响应消息，此响应消息对于其他用户的请求无效。
no-cache指示请求或响应消息不能缓存
no-store用于防止重要的信息被无意的发布。在请求消息中发送将使得请求和响应消息都不使用缓存。
max-age指示客户机可以接收生存期不大于指定时间（以秒为单位）的响应。
min-fresh指示客户机可以接收响应时间小于当前时间加上指定时间的响应。
max-stale指示客户机可以接收超出超时期间的响应消息。如果指定max-stale消息的值，那么客户机可以接收超出超时期指定值之内的响应消息。
Date头域
Date头域表示消息发送的时间，时间的描述格式由rfc822定义。例如，Date:Mon,31Dec200104:25:57GMT。Date描述的时间表示世界标准时，换算成本地时间，需要知道用户所在的时区。
Pragma头域
Pragma头域用来包含实现特定的指令，最常用的是Pragma:no-cache。在HTTP/1.1协议中，它的含义和Cache-Control:no-cache相同。

请求消息
请求消息的第一行为下面的格式：
MethodSPRequest-URISPHTTP-VersionCRLFMethod表示对于Request-URI完成的方法，这个字段是大小写敏感的，包括OPTIONS、GET、HEAD、POST、PUT、DELETE、TRACE。方法GET和HEAD应该被所有的通用WEB服务器支持，其他所有方法的实现是可选的。GET方法取回由Request-URI标识的信息。HEAD方法也是取回由Request-URI标识的信息，只是可以在响应时，不返回消息体。POST方法可以请求服务器接收包含在请求中的实体信息，可以用于提交表单，向新闻组、BBS、邮件群组和数据库发送消息。
SP表示空格。Request-URI遵循URI格式，在此字段为星号（*）时，说明请求并不用于某个特定的资源地址，而是用于服务器本身。HTTP-Version表示支持的HTTP版本，例如为HTTP/1.1。CRLF表示换行回车符。请求头域允许客户端向服务器传递关于请求或者关于客户机的附加信息。请求头域可能包含下列字段Accept、Accept-Charset、Accept-Encoding、Accept-Language、Authorization、From、Host、If-Modified-Since、If-Match、If-None-Match、If-Range、If-Range、If-Unmodified-Since、Max-Forwards、Proxy-Authorization、Range、Referer、User-Agent。对请求头域的扩展要求通讯双方都支持，如果存在不支持的请求头域，一般将会作为实体头域处理。
典型的请求消息：
GEThttp://class/download.microtool.de:80/somedata.exe
Host:download.microtool.de
Accept:*/*
Pragma:no-cache
Cache-Control:no-cache
Referer:http://class/download.microtool.de/
User-Agent:Mozilla/4.04[en](Win95;I;Nav)
Range:bytes=554554-
上例第一行表示HTTP客户端（可能是浏览器、下载程序）通过GET方法获得指定URL下的文件。棕色的部分表示请求头域的信息，绿色的部分表示通用头部分。
Host头域
Host头域指定请求资源的Intenet主机和端口号，必须表示请求url的原始服务器或网关的位置。HTTP/1.1请求必须包含主机头域，否则系统会以400状态码返回。
Referer头域
Referer头域允许客户端指定请求uri的源资源地址，这可以允许服务器生成回退链表，可用来登陆、优化cache等。他也允许废除的或错误的连接由于维护的目的被追踪。如果请求的uri没有自己的uri地址，Referer不能被发送。如果指定的是部分uri地址，则此地址应该是一个相对地址。
Range头域
Range头域可以请求实体的一个或者多个子范围。例如，
表示头500个字节：bytes=0-499
表示第二个500字节：bytes=500-999
表示最后500个字节：bytes=-500
表示500字节以后的范围：bytes=500-
第一个和最后一个字节：bytes=0-0,-1
同时指定几个范围：bytes=500-600,601-999
但是服务器可以忽略此请求头，如果无条件GET包含Range请求头，响应会以状态码206（PartialContent）返回而不是以200（OK）。
User-Agent头域
User-Agent头域的内容包含发出请求的用户信息。
响应消息
响应消息的第一行为下面的格式：
HTTP-VersionSPStatus-CodeSPReason-PhraseCRLF
HTTP-Version表示支持的HTTP版本，例如为HTTP/1.1。Status-Code是一个三个数字的结果代码。Reason-Phrase给Status-Code提供一个简单的文本描述。Status-Code主要用于机器自动识别，Reason-Phrase主要用于帮助用户理解。Status-Code的第一个数字定义响应的类别，后两个数字没有分类的作用。第一个数字可能取5个不同的值：
1xx:信息响应类，表示接收到请求并且继续处理
2xx:处理成功响应类，表示动作被成功接收、理解和接受
3xx:重定向响应类，为了完成指定的动作，必须接受进一步处理
4xx:客户端错误，客户请求包含语法错误或者是不能正确执行
5xx:服务端错误，服务器不能正确执行一个正确的请求
响应头域允许服务器传递不能放在状态行的附加信息，这些域主要描述服务器的信息和Request-URI进一步的信息。响应头域包含Age、Location、Proxy-Authenticate、Public、Retry-After、Server、Vary、Warning、WWW-Authenticate。对响应头域的扩展要求通讯双方都支持，如果存在不支持的响应头域，一般将会作为实体头域处理。
典型的响应消息：
HTTP/1.0200OK
Date:Mon,31Dec200104:25:57GMT
Server:Apache/1.3.14(Unix)
Content-type:text/html
Last-modified:Tue,17Apr200106:46:28GMT
Etag:"a030f020ac7c01:1e9f"
Content-length:39725426
Content-range:bytes554554-40279979/40279980
上例第一行表示HTTP服务端响应一个GET方法。棕色的部分表示响应头域的信息，绿色的部分表示通用头部分，红色的部分表示实体头域的信息。
Location响应头
Location响应头用于重定向接收者到一个新URI地址。
Server响应头
Server响应头包含处理请求的原始服务器的软件信息。此域能包含多个产品标识和注释，产品标识一般按照重要性排序。
实体
请求消息和响应消息都可以包含实体信息，实体信息一般由实体头域和实体组成。实体头域包含关于实体的原信息，实体头包括Allow、Content-Base、Content-Encoding、Content-Language、Content-Length、Content-Location、Content-MD5、Content-Range、Content-Type、Etag、Expires、Last-Modified、extension-header。extension-header允许客户端定义新的实体头，但是这些域可能无法未接受方识别。实体可以是一个经过编码的字节流，它的编码方式由Content-Encoding或Content-Type定义，它的长度由Content-Length或Content-Range定义。
Content-Type实体头
Content-Type实体头用于向接收方指示实体的介质类型，指定HEAD方法送到接收方的实体介质类型，或GET方法发送的请求介质类型Content-Range实体头
Content-Range实体头用于指定整个实体中的一部分的插入位置，他也指示了整个实体的长度。在服务器向客户返回一个部分响应，它必须描述响应覆盖的范围和整个实体长度。一般格式：
Content-Range:bytes-unitSPfirst-byte-pos-last-byte-pos/entity-legth
例如，传送头500个字节次字段的形式：Content-Range:bytes0-499/1234如果一个http消息包含此节（例如，对范围请求的响应或对一系列范围的重叠请求），Content-Range表示传送的范围，Content-Length表示实际传送的字节数。
Last-modified实体头
Last-modified实体头指定服务器上保存内容的最后修订时间。

一、HTTP协议是什么

我们在浏览器的地址栏里输入的网站地址叫做URL(UniformResourceLocator，统一资源定位符)。就像每家每户都有一个门牌地址一样，每个网页也都有一个Internet地址。当你在浏览器的地址框中输入一个URL或是单击一个超级链接时，URL就确定了要浏览的地址。浏览器通过超文本传输协议(HTTP)，将Web服务器上站点的网页代码提取出来，并翻译成漂亮的网页。因此，在我们认识HTTP之前，有必要先弄清楚URL的组成,例如：http://www.microsoft.com/china/index.htm。它的含义如下：

1.http://：代表超文本传输协议，通知microsoft.com服务器显示Web页，通常不用输入；

2.www：代表一个Web(万维网)服务器；

3.Microsoft.com/：这是装有网页的服务器的域名，或站点服务器的名称；

4.China/：为该服务器上的子目录，就好像我们的文件夹；

5.Index.htm：index.htm是文件夹中的一个HTML文件(网页)。

我们知道，Internet的基本协议是TCP/IP协议，然而在TCP/IP模型最上层的是应用层(Applicationlayer)，它包含所有高层的协议。高层协议有：文件传输协议FTP、电子邮件传输协议SMTP、域名系统服务DNS、网络新闻传输协议NNTP和HTTP协议等。

HTTP协议(HypertextTransferProtocol，超文本传输协议)是用于从WWW服务器传输超文本到本地浏览器的传送协议。它可以使浏览器更加高效，使网络传输减少。它不仅保证计算机正确快速地传输超文本文档，还确定传输文档中的哪一部分，以及哪部分内容首先显示(如文本先于图形)等。这就是你为什么在浏览器中看到的网页地址都是以“http://”开头的原因。

自WWW诞生以来，一个多姿多彩的资讯和虚拟的世界便出现在我们眼前，可是我们怎么能够更加容易地找到我们需要的资讯呢？当决定使用超文本作为WWW文档的标准格式后，于是在1990年，科学家们立即制定了能够快速查找这些超文本文档的协议，即HTTP协议。经过几年的使用与发展，得到不断的完善和扩展，目前在WWW中使用的是HTTP/1.0的第六版。

二、HTTP是怎样工作的

既然我们明白了URL的构成，那么HTTP是怎么工作呢？我们接下来就要讨论这个问题。

由于HTTP协议是基于请求/响应范式的(相当于客户机/服务器)。一个客户机与服务器建立连接后，发送一个请求给服务器，请求方式的格式为：统一资源标识符(URL)、协议版本号，后边是MIME信息包括请求修饰符、客户机信息和可能的内容。服务器接到请求后，给予相应的响应信息，其格式为一个状态行，包括信息的协议版本号、一个成功或错误的代码，后边是MIME信息包括服务器信息、实体信息和可能的内容。

许多HTTP通讯是由一个用户代理初始化的并且包括一个申请在源服务器上资源的请求。最简单的情况可能是在用户代理和服务器之间通过一个单独的连接来完成。在Internet上，HTTP通讯通常发生在TCP/IP连接之上。缺省端口是TCP80，但其它的端口也是可用的。但这并不预示着HTTP协议在Internet或其它网络的其它协议之上才能完成。HTTP只预示着一个可靠的传输。

这个过程就好像我们打电话订货一样，我们可以打电话给商家，告诉他我们需要什么规格的商品，然后商家再告诉我们什么商品有货，什么商品缺货。这些，我们是通过电话线用电话联系(HTTP是通过TCP/IP)，当然我们也可以通过传真，只要商家那边也有传真。

以上简要介绍了HTTP协议的宏观运作方式，下面介绍一下HTTP协议的内部操作过程。

在WWW中，“客户”与“服务器”是一个相对的概念，只存在于一个特定的连接期间，即在某个连接中的客户在另一个连接中可能作为服务器。基于HTTP协议的客户/服务器模式的信息交换过程，它分四个过程：建立连接、发送请求信息、发送响应信息、关闭连接。这就好像上面的例子，我们电话订货的全过程。

其实简单说就是任何服务器除了包括HTML文件以外，还有一个HTTP驻留程序，用于响应用户请求。你的浏览器是HTTP客户，向服务器发送请求，当浏览器中输入了一个开始文件或点击了一个超级链接时，浏览器就向服务器发送了HTTP请求，此请求被送往由IP地址指定的URL。驻留程序接收到请求，在进行必要的操作后回送所要求的文件。在这一过程中，在网络上发送和接收的数据已经被分成一个或多个数据包(packet)，每个数据包包括：要传送的数据；控制信息，即告诉网络怎样处理数据包。TCP/IP决定了每个数据包的格式。如果事先不告诉你，你可能不会知道信息被分成用于传输和再重新组合起来的许多小块。

也就是说商家除了拥有商品之外，它也有一个职员在接听你的电话，当你打电话的时候，你的声音转换成各种复杂的数据，通过电话线传输到对方的电话机，对方的电话机又把各种复杂的数据转换成声音，使得对方商家的职员能够明白你的请求。这个过程你不需要明白声音是怎么转换成复杂的数据的。

应用分析 － HTTP网页访问应用分析

一、HTTP协议简介

1.什么是HTTP协议

HTTP，全称Hyper Text Transfer Protocol，中文名为超文本传输协议。

HTTP是一种用于从Web服务器端传送超文本标记语言（HTML－Hyper Text Markup Language）文件到客户端浏览器的传送协议，它是Internet上最常见的协议之一。我们通常访问的网页，就是通过HTTP协议进行传送的。

2.HTTP协议的工作原理

HTTP用名字标识某一资源时（即在浏览器中输入网址），遵循统一资源名（URN－Uniform Resource Name）的规则，当前网络中最常用的URN是统一资源定位符（URL－Uniform Resource Locator），当客户端在浏览器中输入一个URL或单击一个URL超链接时，就确定了要访问的地址。

以http://www.colasoft.com.cn/resource/index.html为例介绍URL的组成：

1) http://：表示使用超文本传输协议，通知Web服务器显示Web页，客户端可不输入；

2) www：代表1个Web服务器；

3) colasoft.com.cn/：Web服务器的域名，或站点服务器的名称；

4) resource/：Web服务器上的子目录，类似机器中的文件夹；

5) index.html：Web服务器上resource子目录中的一个网页文件，即Web服务器传送给客户端浏览器的文件。

HTTP使用TCP协议的80端口进行可靠数据传输，一个HTTP会话由客户端开始发起，包括以下步骤：

1) 客户端在浏览器中标识希望获取信息的URL；

2) 发起HTTP连接请求，启动客户端（UA）和一个初始WWW服务器或代理服务器之间的一个HTTP会话；

3) WWW服务器或代理服务器根据客户端的URL请求将内容传送给客户端。

3.HTTP协议的工作方式

宏观工作方式：

1) 客户端（UA）直接连接到Web服务器的通讯路径如图1所示，客户端与Web服务器之间的通讯不需要任何的中介服务器，这是最简单的情况。

（图1　客户端与Web服务器直接连接）

2) 客户端（UA）通过中介服务器连接到Web服务器的通讯路径如图2所示，客户端与Web服务器之间的通讯通过中介服务器进行转发，中介服务器可能有1个，也可能有多个。

（图2　客户端通过中介服务器与Web服务器连接）

3) 客户端（UA）到中介服务器的通讯路径如图3所示，客户端将请求发送给中介服务器1，中介服务器1将其发送中介服务器2，中介服务器2再发给Web服务器，最后客户端收到的内容由中介服务器1发送给它，而不是Web服务器。

（图3　客户端与中介服务器通讯过程）

内部操作过程：

如图4所示，它分为四个步骤：建立连接、发出请求信息、发出响应信息、关闭连接。

（图4 HTTP协议内部操作过程）

4.HTTP协议的报文格式服务器对HTTP的处理方式
HTTP协议的这种请求/回应的模式，使得服务器只能根据客户程序的请求发送回信息，这样的好处是客户具备很大的自由度，可以任意访问服务器上的信息。因此就存在多个客户同时访问一个服务器的问题。
　　在Unix下，由一个守护进程来监视来自客户程序的请求，当守护进程接受到一个请求时，就建立一个新的进程对请求进行处理。通常服务器能创建足够多的新进程来回应客户的请求，然而如果同时发送请求的客户太多，那么服务器就有可能出现超载的情况，创建进程的速度跟不上众多客户发送请求的速度，这样就造成了服务器对外表现反应迟缓。此外，为了提高用户使用浏览器时的性能，现代浏览器还支持并发的访问方式，浏览一个网页时同时建立多个连接，以迅速获得一个网页上的多个图标，这样能更快速完成整个网页的传输。但是对服务器来讲，更增加了瞬间负载。
　　显然，造成这个问题的关键是服务器对HTTP协议的处理方式，一次请求就要建立一个连接，在网页上充满了多个较小的图象文件的时候，那么服务器和客户程序之间的大部分工作是用于建立连接，而真正用于传递数据的工作却很轻松。因此，更好的利用现有连接，减少建立连接的消耗，就需要能在一次连接中回应多个请求。在HTTP1.1中提供了这种持续连接的方式，而下一代HTTP协议：HTTP-NG更增加了有关会话控制、丰富的内容协商等方式的支持，来提供更高效率的连接。
　　除了针对每次请求都建立一个新进程的处理方式之外，HTTP守护进程也能使用其他的方式处理多个请求，例如使用多线程，或者使用异步方式在不同请求之间进行切换，就能在一个进程内处理多个请求。虽然比起建立新进程来讲，这样消耗的处理器资源略微减少，但是并不能从根本上消除并发访问带来的处理器资源不足的问题。一般使用线程和异步方式的程序较为复杂，不能很容易扩充对新特性的支持，并有可能因为程序内部要自己进行同步等原因也会造成资源消耗。使用这些方式，虽然对处理静态的网页有好处，但对于执行CGI程序，仍然要创建子进程进行处理。因此，大部分运行在Unix上的守护程序仍然使用多进程的方式，这种方式简单却有效。
　　即使对于使用多进程方式进行处理的Web服务器，也有不同的处理方式。Unix系统中提供了超级服务器进程inetd，因此简单的Web服务器可以使用inetd来启动真正的Web服务器。然而，inetd效率不高，使用inetd的服务器不能用作高负载的服务器系统，因此高负载的Web服务器，本身来监听客户连接请求，并负责启动子进程真正处理客户的请求。
　　如果选择的服务器程序的确需要使用inetd来启动，可以选择与inetd功能相同，但效率更高的超级服务器进程tcpserver，它可以比inetd更高效的启动服务进程。

客户端发送的HTTP报文，我们称为请求链；中介服务器或Web服务器发送的HTTP报文，称为响应链。两种报文都遵循以下格式：

l 一般开始行，即请求报文的请求行和应答报文的状态行；

l 总头；

l 报文头；

l 一个空行；

l 报文体。　

HTTP协议三--断点续传

断点续传是我们现在经常接触的概念，那么HTTP协议是如何支持断点续传的呢。我们先从一个例子来看看。
下面是一个断点续传的例子：（使用NetVampire得到）
I01-7-1219:19:23-------------------------Attempt1-------------------------
P01-7-1219:19:24Connectingto127.0.0.3...
P01-7-1219:19:24Connectedto127.0.0.3[127.0.0.3]
S01-7-1219:19:24GET/VS0515AI.EXEHTTP/1.1
S01-7-1219:19:24Connection:close
S01-7-1219:19:24Host:127.0.0.3
S01-7-1219:19:24Accept:*/*
S01-7-1219:19:24Pragma:no-cache
S01-7-1219:19:24Cache-Control:no-cache
S01-7-1219:19:24Referer:http://127.0.0.3/
S01-7-1219:19:24User-Agent:Mozilla/4.04[en](Win95;I;Nav)
S01-7-1219:19:24
R01-7-1219:19:24HTTP/1.1200OK
R01-7-1219:19:24Server:ZeroHttpServer/1.0
R01-7-1219:19:24Date:Thu,12Jul200111:19:24GMT
R01-7-1219:19:24Cache-Control:no-cache
R01-7-1219:19:24Last-Modified:Tue,30Jan200113:11:30GMT
R01-7-1219:19:24Content-Type:application/octet-stream
R01-7-1219:19:24Content-Length:15143086
R01-7-1219:19:24Connection:close
R01-7-1219:19:24
P01-7-1219:19:25Datatransferstarted
I01-7-1219:19:32JobStoppedbyuser
I01-7-1219:19:33Received5275648bytesin0:00:07(691435bytes/s)
I01-7-1219:19:40-------------------------Attempt2-------------------------
P01-7-1219:19:40Connectingto127.0.0.3...
P01-7-1219:19:40Connectedto127.0.0.3[127.0.0.3]
S01-7-1219:19:40GET/VS0515AI.EXEHTTP/1.1
S01-7-1219:19:40Connection:close
S01-7-1219:19:40Host:127.0.0.3
S01-7-1219:19:40Accept:*/*
S01-7-1219:19:40Pragma:no-cache
S01-7-1219:19:40Cache-Control:no-cache
S01-7-1219:19:40Referer:http://127.0.0.3/
S01-7-1219:19:40User-Agent:Mozilla/4.04[en](Win95;I;Nav)
S01-7-1219:19:40Range:bytes=5275648-
S01-7-1219:19:40
R01-7-1219:19:40HTTP/1.1206PartialContent
R01-7-1219:19:40Server:ZeroHttpServer/1.0
R01-7-1219:19:40Date:Thu,12Jul200111:19:40GMT
R01-7-1219:19:40Cache-Control:no-cache
R01-7-1219:19:40Last-Modified:Tue,30Jan200113:11:30GMT
R01-7-1219:19:40Content-Type:application/octet-stream
R01-7-1219:19:40Content-Range:bytes5275648-15143085/15143086
R01-7-1219:19:40Content-Length:9867438
R01-7-1219:19:40Connection:close
R01-7-1219:19:40
P01-7-1219:19:40Datatransferstarted
I01-7-1219:19:41JobStoppedbyuser
I01-7-1219:19:41Received1124756bytesin0:00:01(969617bytes/s)
第一次是普通的传输；第二次由于没有传完全，就发出了Range这个头部，从5275648字节开始传输（默认是按字节算），回应使用206状态值，表示现在开始部分传输，回复Content-Length头部，表示传输的部分，用字节记，然后就与普通传输没有区别了。
通过上面的例子，你应该了解HTTP断点续传的原理了吧。

二、分析HTTP通讯

1.分析HTTP访问的具体流程

我们使用科来网络分析系统5.0捕获并分析一个HTTP通讯过程，客户端主机名为“wangym”，客户端浏览器是IE6.0，请求的域名是“www.colasoft.com.cn”。

在客户端上打开科来网络分析系统5.0。为避免数据干扰，可以设定一个过滤器，只捕获本机的数据通讯。设定好后开始数据捕获，同时在本机的浏览器中输入www.colasoft.com.cn，待网页全部打开后，停止捕获。

注意：此文里提到的HTTP访问均指标准80端口的通信，对于非80端口的HTTP访问，用户可在“工程->高级分析模块->HTTP分析模块->常规设置->端口”处进行更改，系统默认为80，当HTTP服务有多个端口时，多个端口之间用分号分隔，如80;8080。

1) HTTP请求

图5所示的是科来网络分析系统5.0对上面访问www.colasoft.com.cn的操作的HTTP请求报文跟踪。

（图5 HTTP GET请求操作）

从图5中的数据包列表可知，上述操作中HTTP请求的原始信息如下：

1) 第1个数据包是DNS查询数据包，本机通过DNS查询获得www.colasoft.com.cn对应的IP地址。

2) 第2个数据包是DNS回应数据包，DNS服务器查询到域名www.colasoft.com.cn对应的IP是64.246.27.237，并将查询结果传送给客户端。

3) 3、4、5数据包是TCP连接的三次握手数据包，连接的双方是本机与域名www.colasoft.com.cn对应的IP地址64.246.27.237。

4) 第6个数据包是客户端发起的HTTP GET请求，向Web服务器处请求获得内容，第7帧的解码包含了GET请求的各参数信息。

上述HTTP访问的HTTP请求方法是GET，而GET仅仅是HTTP众多方法中的一种，HTTP通过不同的方法实现不同的功能，下表列出了HTTP常见的请求方法。

方法	描述
GET	向Web服务器请求一个文件
POST	向Web服务器发送数据让Web服务器进行处理
PUT	向Web服务器发送数据并存储在Web服务器内部
HEAD	检查一个对象是否存在
DELETE	从Web服务器上删除一个文件
CONNECT	对通道提供支持
TRACE	跟踪到服务器的路径
OPTIONS	查询Web服务器的性能

（表1 HTTP常见请求方法）

每个HTTP请求都包含两个部分：

1) HTTP请求行，大多情况下为GET或POST；

2) HTTP请求中的可选消息头，这些消息头会由于使用的HTTP客户端浏览器或客户端浏览器配置选项的不同而不同。

具体分析图5中第6个数据包的HTTP请求解码，可以得到如下信息：

1) HTTP请求：请求的方法是GET，“/”表示请求Web服务器的根目录，“HTTP/1.1”表示的是URI（Uniform Resource Identifier，统一资源标识符）及其版本；

2) Accept：指定客户端能够接收的内容类型，内容类型中的先后次序表示客户端接收的先后次序。这里可以看到客户端能够接收的类型有gif、bitmap、jpeg等等。

3) Accept-Language：指定优先选择的语言是中文；

4) Accept-Encoding：指定内容编码类型为gzip或deflate；

5) User-Agent：包含HTTP客户端运行的浏览器类型；

6) Host：包含的主机信息为www.colasoft.com.cn。

7) Connection：指定的连接类型为Keep-Alive。

注意：在传送一个网页时，Web服务器会同时打开多个TCP连接，如每一张图片都单独使用一个TCP连接进行传送。

超文本传输协议HTTP(二)

用于支持WWW浏览的网络协议为HTTP，这是一种最基本的客户机/服务器的访问协议。浏览器向服务器发送请求，而服务器回应相应的网页。HTTP协议从1990年开始出现，发展到当前的HTTP1.1标准，已经有了相当多的扩展，然而其最基本的实现是非常简单的，服务器需要进行的额外处理相当少，这也是为什么Web服务器软件如此众多的原因之一。
请求方法
通常，HTTP协议使用端口80来提供客户访问，因此也可以使用其他的网络软件，如telnet，模拟客户向服务器发送请求，来查看HTTP的传输方式。
$telnetwebserver80
Trying192.168.0.1...
Connectedtowebserver.
Escapecharacteris'^]'.
GET/index.html
　　当telnet显示了Connect等信息建立了连接之后，服务器就等待使用者输入请求，而不进行任何提示。上例中，使用者输入GET/index.html指令，则服务器立即将相应的网页返回，然后关闭连接。
　　客户程序向服务器发送的请求可以有不同的类型，这样服务器可以根据不同的请求类型进行不同的处理。在HTTP1.0中，定义了三种最基本的请求类型，GET、POST和HEAD，这些请求方法的实现方式均与上例相同，客户程序用大写指令将请求发送给服务器，后面跟随具体的数据。
GET请求最为常见，它后面跟随一个网页的位置，服务器接受请求并返回其请求的页面。除了页面位置作参数之外，请求还可以跟随协议的版本如HTTP/1.0等作为参数，以发送给服务器更多的信息。
POST请求要求服务器接收大量的信息，除了POST后面跟随的参数之外，浏览器还会在后面持续发送数据，让服务器进行处理。通常，POST方法是和CGI程序分不开的，服务器应该启动一个CGI程序来处理POST发送来的数据。
HEAD请求在客户程序和服务器之间进行交流，而不会返回具体的文档。当使用GET和POST方法时，服务器最后都将结果文档返回给客户程序，浏览器将刷新显示。而HEAD请求则不同，它仅仅交流一些内部数据，这些数据不会影响浏览的过程。因此HEAD方法通常不单独使用，而是和其他的请求方法一起起到辅助作用。一些搜寻引擎使用的自动搜索机器人使用这个方法来获得网页的标志信息，或者进行安全认证时，使用这个方法来传递认证信息。
　　除了这三种最常见的访问方法之外，在HTTP1.1中还定义了更多的访问方法类型，如PUT，用于将网页放置到正确位置，DELETE用于删除相关文档等。这些方法并不常用，因而大部分Web服务器软件并没有实现他们。然而对于特定场合他们还是非常有用的，例如使用软件编辑网页时，网页编辑器可以使用这些方法，管理不同的网页。
　　如果服务器不支持客户发送的请求方法，服务器将返回错误并立即关闭连接。

应用分析－ HTTP网页访问应用分析(3)

2) HTTP响应

Web服务器在收到HTTP请求后，会向HTTP客户端发送一个应答响应。

图6所示的是科来网络分析系统5.0对上面访问www.colasoft.com.cn的操作的HTTP响应报文跟踪。

（图6 HTTP响应）

图6中第8个数据包即是Web服务器返回给客户端的HTTP响应数据包，详细查看其解码，可以得到如下信息：

1) HTTP响应：“HTTP/1.1”表示的是URI（Uniform Resource Identifier，统一资源标识符）及其版本，“200 OK”是HTTP响应的状态码，表示客户端请示的页面存在，且状态正常。

2) Date：显示当前的时间。

3) Server：显示支持当前请求页面的Web服务器的类型。

4) X-Powered-By：显示当前请求页面的脚本类型。

5) Set-Cookie：显示此HTTP连接的Cookie信息。

6) Keep-Alive：显示此HTTP连接的Keep-Alive时间。

7) Connection：显示此HTTP连接的类型为Keep-Alive。

8) Transfer-Encoding：显示此HTTP连接的传输编码。

9) Content-Type：显示此HTTP连接的内容类型。

10) Line1-N：Web服务器传送给客户端浏览器的HTML代码。

在以太网中，数据包的大小在64-1518字节之间，如果客户端请求的页面大于1518字节，则会将请求的页面分段传送给客户端，客户端浏览器接收到Web服务器传送给自己的HTML代码后，便开始读取数据并将其显示为网页。

HTTP的不同状态码表示HTTP响应的不同类型，主要包括：

代码	描述
1xx	信息
2xx	成功
3xx	重定向
4xx	客户端错误
5xx	服务器端错误

（表2 HTTP响应状态码）

3) HTTP访问流程

通过上面对访问www.colasoft.com.cn的报文进行跟踪分析，我们可以总结出HTTP的工作流程图如图7所示。

注意：HTTP访问可以使用域名，也可直接使用IP地址，在使用IP进行访问时，将不会产生图5中第1和第2个所表示的DNS数据包，故此HTTP流程图里未包括DNS部分，而直接从TCP的三次握手开始。

（图7 HTTP访问流程图）

图7表示HTTP的访问流程如下：

客户端向服务器发送一个TCP连接的SYN请求（1），服务器在收到此请求后使用一个SYN/ACK的数据包对其进行响应（2），而客户端在收到此响应后再次向其发送一个ACK数据包进行确认（3），此时，TCP连接成功建立。在连接建立后，客户端立即使用请求方法（通常为GET或POST）向服务器请求数据（4），一般情况下这时服务器会向客户端回应其相应的HTTP报头和数据（5），但在某些情况下（脚本比较复杂，需耗费大量时间执行）开始的时候只能返回HTTP的报头，而数据（6、7、N）可能会在相隔一段时间后再单独地分组进行传输，当数据传输完后，客户端发送FIN数据包关闭连接。

对应图7中的标识，1－2的时间表示客户端和服务器之间路由所用的时间，4－5的时间为服务器的响应时间、5－N（此时5只返回了HTTP报头）所用的时间为服务器上脚本程序所用的时间。科来网络分析系统5.0中，对于每个数据包都可查看其绝对时间和相对时间（设定某个数据包为基准），在遇到访问网页速度慢的情况时，捕获HTTP的访问并查看相应的时间，即可确定访问速度慢的原因并排查故障。

附件：

1、建立连接协议（三次握手）
（1）客户端发送一个带SYN标志的TCP报文到服务器。这是三次握手过程中的报文1。
（2）服务器端回应客户端的，这是三次握手中的第2个报文，这个报文同时带ACK标志和SYN标志。因此它表示对刚才客户端SYN报文的回应；同时又标志SYN给客户端，询问客户端是否准备好进行数据通讯。
（3）客户必须再次回应服务段一个ACK报文，这是报文段3。
2、连接终止协议（四次挥手）
　　由于TCP连接是全双工的，因此每个方向都必须单独进行关闭。这原则是当一方完成它的数据发送任务后就能发送一个FIN来终止这个方向的连接。收到一个 FIN只意味着这一方向上没有数据流动，一个TCP连接在收到一个FIN后仍能发送数据。首先进行关闭的一方将执行主动关闭，而另一方执行被动关闭。
　（1） TCP客户端发送一个FIN，用来关闭客户到服务器的数据传送（报文段4）。
　（2）服务器收到这个FIN，它发回一个ACK，确认序号为收到的序号加1（报文段5）。和SYN一样，一个FIN将占用一个序号。
　（3）服务器关闭客户端的连接，发送一个FIN给客户端（报文段6）。
　（4）客户段发回ACK报文确认，并将确认序号设置为收到序号加1（报文段7）。
CLOSED: 这个没什么好说的了，表示初始状态。
LISTEN: 这个也是非常容易理解的一个状态，表示服务器端的某个SOCKET处于监听状态，可以接受连接了。
SYN_RCVD: 这个状态表示接受到了SYN报文，在正常情况下，这个状态是服务器端的SOCKET在建立TCP连接时的三次握手会话过程中的一个中间状态，很短暂，基本上用netstat你是很难看到这种状态的，除非你特意写了一个客户端测试程序，故意将三次TCP握手过程中最后一个ACK报文不予发送。因此这种状态时，当收到客户端的ACK报文后，它会进入到ESTABLISHED状态。
SYN_SENT: 这个状态与SYN_RCVD遥想呼应，当客户端SOCKET执行CONNECT连接时，它首先发送SYN报文，因此也随即它会进入到了SYN_SENT状态，并等待服务端的发送三次握手中的第2个报文。SYN_SENT状态表示客户端已发送SYN报文。
ESTABLISHED：这个容易理解了，表示连接已经建立了。
FIN_WAIT_1: 这个状态要好好解释一下，其实FIN_WAIT_1和FIN_WAIT_2状态的真正含义都是表示等待对方的FIN报文。而这两种状态的区别是：FIN_WAIT_1状态实际上是当SOCKET在ESTABLISHED状态时，它想主动关闭连接，向对方发送了FIN报文，此时该SOCKET即进入到FIN_WAIT_1状态。而当对方回应ACK报文后，则进入到FIN_WAIT_2状态，当然在实际的正常情况下，无论对方何种情况下，都应该马上回应ACK报文，所以FIN_WAIT_1状态一般是比较难见到的，而FIN_WAIT_2状态还有时常常可以用netstat看到。
FIN_WAIT_2：上面已经详细解释了这种状态，实际上FIN_WAIT_2状态下的SOCKET，表示半连接，也即有一方要求close连接，但另外还告诉对方，我暂时还有点数据需要传送给你，稍后再关闭连接。
TIME_WAIT: 表示收到了对方的FIN报文，并发送出了ACK报文，就等2MSL后即可回到CLOSED可用状态了。如果FIN_WAIT_1状态下，收到了对方同时带 FIN标志和ACK标志的报文时，可以直接进入到TIME_WAIT状态，而无须经过FIN_WAIT_2状态。
CLOSING: 这种状态比较特殊，实际情况中应该是很少见，属于一种比较罕见的例外状态。正常情况下，当你发送FIN报文后，按理来说是应该先收到（或同时收到）对方的 ACK报文，再收到对方的FIN报文。但是CLOSING状态表示你发送FIN报文后，并没有收到对方的ACK报文，反而却也收到了对方的FIN报文。什么情况下会出现此种情况呢？其实细想一下，也不难得出结论：那就是如果双方几乎在同时close一个SOCKET的话，那么就出现了双方同时发送FIN报文的情况，也即会出现CLOSING状态，表示双方都正在关闭SOCKET连接。
CLOSE_WAIT: 这种状态的含义其实是表示在等待关闭。怎么理解呢？当对方close一个SOCKET后发送FIN报文给自己，你系统毫无疑问地会回应一个ACK报文给对方，此时则进入到CLOSE_WAIT状态。接下来呢，实际上你真正需要考虑的事情是察看你是否还有数据发送给对方，如果没有的话，那么你也就可以 close这个SOCKET，发送FIN报文给对方，也即关闭连接。所以你在CLOSE_WAIT状态下，需要完成的事情是等待你去关闭连接。
LAST_ACK: 这个状态还是比较容易好理解的，它是被动关闭一方在发送FIN报文后，最后等待对方的ACK报文。当收到ACK报文后，也即可以进入到CLOSED可用状态了。
最后有2个问题的回答，我自己分析后的结论（不一定保证100%正确）
1、为什么建立连接协议是三次握手，而关闭连接却是四次握手呢？
这是因为服务端的LISTEN状态下的SOCKET当收到SYN报文的建连请求后，它可以把ACK和SYN（ACK起应答作用，而SYN起同步作用）放在一个报文里来发送。但关闭连接时，当收到对方的FIN报文通知时，它仅仅表示对方没有数据发送给你了；但未必你所有的数据都全部发送给对方了，所以你可以未必会马上会关闭SOCKET,也即你可能还需要发送一些数据给对方之后，再发送FIN报文给对方来表示你同意现在可以关闭连接了，所以它这里的ACK报文和FIN报文多数情况下都是分开发送的。
2、为什么TIME_WAIT状态还需要等2MSL后才能返回到CLOSED状态？
这是因为：虽然双方都同意关闭连接了，而且握手的4个报文也都协调和发送完毕，按理可以直接回到CLOSED状态（就好比从SYN_SEND状态到 ESTABLISH状态那样）；但是因为我们必须要假想网络是不可靠的，你无法保证你最后发送的ACK报文会一定被对方收到，因此对方处于 LAST_ACK状态下的SOCKET可能会因为超时未收到ACK报文，而重发FIN报文，所以这个TIME_WAIT状态的作用就是用来重发可能丢失的 ACK报文。

三、总结

以上简单介绍了HTTP协议，并使用科来网络分析分析系统5.0跟踪分析了访问一个网页的具体流程。据此，用户在遇到网页访问故障时，即可结合上述的HTTP相关知识，使用网络检测分析软件（这儿是科来网络分析系统5.0）对HTTP访问的报文进行跟踪分析，以完成对此类故障的快速排查

什么是长连接、短连接？

2009-07-30 11:38

什么是长连接，什么是短连接？
贴个经典的,看完了就应该没啥问题了 :
TCP/IP通信程序设计的丰富多样性
刚接触TCP/IP通信设计的人根据范例可以很快编出一个通信程序，据此一些人可能会认为TCP/IP编程很简单。其实不然， TCP/IP编程具有较为丰富的内容。其编程的丰富性主要体现在通信方式和报文格式的多样性上。
一。通信方式
主要有以下三大类:
(一)SERVER/CLIENT方式
1.一个Client方连接一个Server方，或称点对点(peer to peer)：
2.多个Client方连接一个Server方，这也是通常的并发服务器方式。
3.一个Client方连接多个Server方，这种方式很少见，主要
用于一个客户向多个服务器发送请求情况。
(二)连接方式
1.长连接
Client方与Server方先建立通讯连接，连接建立后不断开，然后再进行报文发送和接收。这种方式下由于通讯连接一直存在，可以用下面命令查看连接是否建立：
netstat –f inet|grep 端口号(如5678)。
此种方式常用于点对点通讯。
2.短连接
Client方与Server每进行一次报文收发交易时才进行通讯连接，交易完毕后立即断开连接。此种方式常用于一点对多点通讯，比如多个Client连接一个Server.
(三)发送接收方式
1.异步
报文发送和接收是分开的，相互独立的，互不影响。这种方式又分两种情况：
(1)异步双工：接收和发送在同一个程序中，有两个不同的子进程分别负责发送和接收
(2)异步单工：接收和发送是用两个不同的程序来完成。
2.同步
报文发送和接收是同步进行，既报文发送后等待接收返回报文。同步方式一般需要考虑超时问题，即报文发上去后不能无限等待，需要设定超时时间，超过该时间发送方不再等待读返回报文，直接通知超时返回。
实际通信方式是这三类通信方式的组合。比如一般书上提供的 TCP/IP范例程序大都是同步短连接的SERVER/CLIENT程序。有的组合是基本不用的，比较常用的有价值的组合是以下几种：
同步短连接Server/Client
同步长连接Server/Client
异步短连接Server/Client
异步长连接双工Server/Client
异步长连接单工Server/Client
其中异步长连接双工是最为复杂的一种通信方式，有时候经常会出现在不同银行或不同城市之间的两套系统之间的通信。比如金卡工程。由于这几种通信方式比较固定，所以可以预先编制这几种通信方式的模板程序。
二.报文格式
通信报文格式多样性更多，相应地就必须设计对应的读写报文的接收和发送报文函数。
(一)阻塞与非阻塞方式　
1.非阻塞方式
读函数不停地进行读动作，如果没有报文接收到，等待一段时间后超时返回，这种情况一般需要指定超时时间。
2.阻塞方式
如果没有报文接收到，则读函数一直处于等待状态，直到有报文到达。
(二)循环读写方式
1.一次直接读写报文
在一次接收或发送报文动作中一次性不加分别地全部读取或全部发送报文字节。
2.不指定长度循环读写
这一般发生在短连接进程中，受网络路由等限制，一次较长的报文可能在网络传输过程中被分解成了好几个包。一次读取可能不能全部读完一次报文，这就需要循环读报文，直到读完为止。
3.带长度报文头循环读写
这种情况一般是在长连接进程中，由于在长连接中没有条件能够判断循环读写什么时候结束，所以必须要加长度报文头。读函数先是读取报文头的长度，再根据这个长度去读报文.实际情况中，报头的码制格式还经常不一样，如果是非ASCII码的报文头，还必须转换成ASCII,常见的报文头码制有：
(1)n个字节的ASCII码
(2)n个字节的BCD码
(3)n个字节的网络整型码
以上是几种比较典型的读写报文方式，可以与通信方式模板一起预先提供一些典型的API读写函数。当然在实际问题中，可能还必须编写与对方报文格式配套的读写API.

HTTP1.1状态代码及其含义

2009-08-24 16:59

100 Continue 初始的请求已经接受，客户应当继续发送请求的其余部分。（HTTP 1.1新）

101 Switching Protocols 服务器将遵从客户的请求转换到另外一种协议（HTTP 1.1新）

200 OK 一切正常，对GET和POST请求的应答文档跟在后面。

201 Created 服务器已经创建了文档，Location头给出了它的URL。

202 Accepted 已经接受请求，但处理尚未完成。

203 Non-Authoritative Information 文档已经正常地返回，但一些应答头可能不正确，因为使用的是文档的拷贝（HTTP 1.1新）。

204 No Content 没有新文档，浏览器应该继续显示原来的文档。如果用户定期地刷新页面，而Servlet可以确定用户文档足够新，这个状态代码是很有用的。

205 Reset Content 没有新的内容，但浏览器应该重置它所显示的内容。用来强制浏览器清除表单输入内容（HTTP 1.1新）。
206 Partial Content 客户发送了一个带有Range头的GET请求，服务器完成了它（HTTP 1.1新）。
300 Multiple Choices 客户请求的文档可以在多个位置找到，这些位置已经在返回的文档内列出。如果服务器要提出优先选择，则应该在Location应答头指明。
301 Moved Permanently 客户请求的文档在其他地方，新的URL在Location头中给出，浏览器应该自动地访问新的URL。

302 Found 类似于301，但新的URL应该被视为临时性的替代，而不是永久性的。注意，在HTTP1.0中对应的状态信息是“Moved Temporatily”。
出现该状态代码时，浏览器能够自动访问新的URL，因此它是一个很有用的状态代码。

注意这个状态代码有时候可以和301替换使用。例如，如果浏览器错误地请求http://host/~user（缺少了后面的斜杠），有的服务器返回301，有的则返回302。

严格地说，我们只能假定只有当原来的请求是GET时浏览器才会自动重定向。请参见307。
303 See Other 类似于301/302，不同之处在于，如果原来的请求是POST，Location头指定的重定向目标文档应该通过GET提取（HTTP 1.1新）。

304 Not Modified 客户端有缓冲的文档并发出了一个条件性的请求（一般是提供If-Modified-Since头表示客户只想比指定日期更新的文档）。服务器告诉客户，原来缓冲的文档还可以继续使用。

305 Use Proxy 客户请求的文档应该通过Location头所指明的代理服务器提取（HTTP 1.1新）。

307 Temporary Redirect 和302（Found）相同。许多浏览器会错误地响应302应答进行重定向，即使原来的请求是POST，即使它实际上只能在POST请求的应答是303时才能重定向。由于这个原因，HTTP 1.1新增了307，以便更加清除地区分几个状态代码：当出现303应答时，浏览器可以跟随重定向的GET和POST请求；如果是307应答，则浏览器只能跟随对GET请求的重定向。（HTTP 1.1新）

400 Bad Request 请求出现语法错误。

401 Unauthorized 客户试图未经授权访问受密码保护的页面。应答中会包含一个WWW-Authenticate头，浏览器据此显示用户名字/密码对话框，然后在填写合适的Authorization头后再次发出请求。

403 Forbidden 资源不可用。服务器理解客户的请求，但拒绝处理它。通常由于服务器上文件或目录的权限设置导致。

404 Not Found 无法找到指定位置的资源。这也是一个常用的应答。

405 Method Not Allowed 请求方法（GET、POST、HEAD、Delete、PUT、TRACE等）对指定的资源不适用。（HTTP 1.1新）

406 Not Acceptable 指定的资源已经找到，但它的MIME类型和客户在Accpet头中所指定的不兼容（HTTP 1.1新）。

407 Proxy Authentication Required 类似于401，表示客户必须先经过代理服务器的授权。（HTTP 1.1新）

408 Request Timeout 在服务器许可的等待时间内，客户一直没有发出任何请求。客户可以在以后重复同一请求。（HTTP 1.1新）

409 Conflict 通常和PUT请求有关。由于请求和资源的当前状态相冲突，因此请求不能成功。（HTTP 1.1新）

410 Gone 所请求的文档已经不再可用，而且服务器不知道应该重定向到哪一个地址。它和404的不同在于，返回407表示文档永久地离开了指定的位置，而404表示由于未知的原因文档不可用。（HTTP 1.1新）

411 Length Required 服务器不能处理请求，除非客户发送一个Content-Length头。（HTTP 1.1新）

412 Precondition Failed 请求头中指定的一些前提条件失败（HTTP 1.1新）。

413 Request Entity Too Large 目标文档的大小超过服务器当前愿意处理的大小。如果服务器认为自己能够稍后再处理该请求，则应该提供一个Retry-After头（HTTP 1.1新）。

414 Request URI Too Long URI太长（HTTP 1.1新）。

416 Requested Range Not Satisfiable 服务器不能满足客户在请求中指定的Range头。（HTTP 1.1新）

500 Internal Server Error 服务器遇到了意料不到的情况，不能完成客户的请求。

501 Not Implemented 服务器不支持实现请求所需要的功能。例如，客户发出了一个服务器不支持的PUT请求。

502 Bad Gateway 服务器作为网关或者代理时，为了完成请求访问下一个服务器，但该服务器返回了非法的应答。

503 Service Unavailable 服务器由于维护或者负载过重未能应答。例如，Servlet可能在数据库连接池已满的情况下返回503。服务器返回503时可以提供一个Retry-After头。

504 Gateway Timeout 由作为代理或网关的服务器使用，表示不能及时地从远程服务器获得应答。（HTTP 1.1新）

505 HTTP Version Not Supported 服务器不支持请求中所指明的HTTP版本。（HTTP 1.1新）

HTTP状态列表

响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。
响应码分五种类型，由它们的第一位数字表示：
1xx：信息，请求收到，继续处理
2xx：成功，行为被成功地接受、理解和采纳
3xx：重定向，为了完成请求，必须进一步执行的动作
4xx：客户端错误，请求包含语法错误或者请求无法实现
5xx：服务器错误，服务器不能实现一种明显无效的请求
下表显示每个响应码及其含义：
100 => “HTTP/1.1 100 Continue” //继续
101 => “HTTP/1.1 101 Switching Protocols” //分组交换协议
200 => “HTTP/1.1 200 OK” //OK
201 => “HTTP/1.1 201 Created” //被创建
202 => “HTTP/1.1 202 Accepted” //被采纳
203 => “HTTP/1.1 203 Non-Authoritative Information” //非授权信息
204 => “HTTP/1.1 204 No Content” //无内容
205 => “HTTP/1.1 205 Reset Content” //重置内容
206 => “HTTP/1.1 206 Partial Content” //部分内容
300 => “HTTP/1.1 300 Multiple Choices” //多选项
301 => “HTTP/1.1 301 Moved Permanently” //永久地传送
302 => “HTTP/1.1 302 Found” //找到
303 => “HTTP/1.1 303 See Other” //参见其他
304 => “HTTP/1.1 304 Not Modified” //未改动
305 => “HTTP/1.1 305 Use Proxy” //使用代理
307 => “HTTP/1.1 307 Temporary Redirect” //暂时重定向
400 => “HTTP/1.1 400 Bad Request” //错误请求
401 => “HTTP/1.1 401 Unauthorized” //未授权
402 => “HTTP/1.1 402 Payment Required” //要求付费
403 => “HTTP/1.1 403 Forbidden” //禁止
404 => “HTTP/1.1 404 Not Found” //未找到
405 => “HTTP/1.1 405 Method Not Allowed” //不允许的方法
406 => “HTTP/1.1 406 Not Acceptable” //不被采纳
407 => “HTTP/1.1 407 Proxy Authentication Required” //要求代理授权
408 => “HTTP/1.1 408 Request Time-out” //请求超时
409 => “HTTP/1.1 409 Conflict” //冲突
410 => “HTTP/1.1 410 Gone” //过期的
411 => “HTTP/1.1 411 Length Required” //要求的长度
412 => “HTTP/1.1 412 Precondition Failed” //前提不成立
413 => “HTTP/1.1 413 Request Entity Too Large” //请求实例太大
414 => “HTTP/1.1 414 Request-URI Too Large” //请求URI太大
415 => “HTTP/1.1 415 Unsupported Media Type” //不支持的媒体类型
416 => “HTTP/1.1 416 Requested range not satisfiable” //无法满足的请求范围
417 => “HTTP/1.1 417 Expectation Failed” //失败的预期
500 => “HTTP/1.1 500 Internal Server Error” //内部服务器错误
501 => “HTTP/1.1 501 Not Implemented” //未被使用
502 => “HTTP/1.1 502 Bad Gateway” //网关错误
503 => “HTTP/1.1 503 Service Unavailable” //不可用的服务
504 => “HTTP/1.1 504 Gateway Time-out” //网关超时
505 => “HTTP/1.1 505″ //HTTP版本未被支持

HTTP协议的运作方式

HTTP协议是基于请求／响应范式的。一个客户机与服务器建立连接后，发送一个请求给服务器，请求方式的格式为，统一资源标识符、协议版本号，后边是MIME信息包括请求修饰符、客户机信息和可能的内容。服务器接到请求后，给予相应的响应信息，其格式为一个状态行包括信息的协议版本号、一个成功或错误的代码，后边是MIME信息包括服务器信息、实体信息和可能的内容。
　　许多HTTP通讯是由一个用户代理初始化的并且包括一个申请在源服务器上资源的请求。最简单的情况可能是在用户代理(UA)和源服务器(O)之间通过一个单独的连接来完成(见图2-1)。
图2-1

　　当一个或多个中介出现在请求／响应链中时，情况就变得复杂一些。中介由三种：代理(Proxy)、网关(Gateway)和通道(Tunnel)。一个代理根据URI的绝对格式来接受请求，重写全部或部分消息，通过URI的标识把已格式化过的请求发送到服务器。网关是一个接收代理，作为一些其它服务器的上层，并且如果必须的话，可以把请求翻译给下层的服务器协议。一个通道作为不改变消息的两个连接之间的中继点。当通讯需要通过一个中介(例如：防火墙等)或者是中介不能识别消息的内容时，通道经常被使用。图2-2>
　　上面的图2-2表明了在用户代理(UA)和源服务器(O)之间有三个中介(A,B和C)。一个通过整个链的请求或响应消息必须经过四个连接段。这个区别是重要的，因为一些HTTP通讯选择可能应用于最近的连接、没有通道的邻居，应用于链的终点或应用于沿链的所有连接。尽管图2-2是线性的，每个参与者都可能从事多重的、并发的通讯。例如，B可能从许多客户机接收请求而不通过A，并且／或者不通过C把请求送到A，在同时它还可能处理A的请求。
　　任何针对不作为通道的汇聚可能为处理请求启用一个内部缓存。缓存的效果是请求／响应链被缩短，条件是沿链的参与者之一具有一个缓存的响应作用于那个请求。下图说明结果链，其条件是针对一个未被UA或A加缓存的请求，B有一个经过C来自O的一个前期响应的缓存拷贝。
图2-3

在Internet上，HTTP通讯通常发生在TCP/IP连接之上。缺省端口是TCP80，但其它的端口也是可用的。但这并不预示着HTTP协议在Internet或其它网络的其它协议之上才能完成。HTTP只预示着一个可靠的传输。
　　以上简要介绍了HTTP协议的宏观运作方式，下面介绍一下HTTP协议的内部操作过程。
　　首先，简单介绍基于HTTP协议的客户/服务器模式的信息交换过程，如图2-4所示，它分四个过程，建立连接、发送请求信息、发送响应信息、关闭连接。
图2-4
　　在WWW中，“客户”与“服务器”是一个相对的概念，只存在于一个特定的连接期间，即在某个连接中的客户在另一个连接中可能作为服务器。WWW服务器运行时，一直在TCP80端口(WWW的缺省端口)监听，等待连接的出现。
　　下面，讨论HTTP协议下客户/服务器模式中信息交换的实现。　　1.建立连接　　连接的建立是通过申请套接字(Socket)实现的。客户打开一个套接字并把它约束在一个端口上，如果成功，就相当于建立了一个虚拟文件。以后就可以在该虚拟文件上写数据并通过网络向外传送。
2.发送请求
　　打开一个连接后，客户机把请求消息送到服务器的停留端口上，完成提出请求动作。
HTTP/1.0　　请求消息的格式为：
　　请求消息=请求行(通用信息|请求头|实体头)CRLF[实体内容]
　　请求　行=方法　请求URL HTTP版本号　CRLF
　　方　　法=GET|HEAD|POST|扩展方法
U R L=协议名称+宿主名+目录与文件名
　　请求行中的方法描述指定资源中应该执行的动作，常用的方法有GET、HEAD和POST。不同的请求对象对应GET的结果是不同的，对应关系如下：
　　对象　　　　　　GET的结果
　　文件　　　　　　文件的内容
　　程序　　　　　　该程序的执行结果
　　数据库查询　　　查询结果
HEAD——要求服务器查找某对象的元信息，而不是对象本身。
POST——从客户机向服务器传送数据，在要求服务器和CGI做进一步处理时会用到POST方法。POST主要用于发送HTML文本中FORM的内容，让CGI程序处理。
　　一个请求的例子为：
GEThttp://networking.zju.edu.cn/zju/index.htmHTTP/1.0
　　头信息又称为元信息，即信息的信息，利用元信息可以实现有条件的请求或应答。
　　请求头——告诉服务器怎样解释本次请求，主要包括用户可以接受的数据类型、压缩方法和语言等。
　　实体头——实体信息类型、长度、压缩方法、最后一次修改时间、数据有效期等。
　　实体——请求或应答对象本身。
3.发送响应
　　服务器在处理完客户的请求之后，要向客户机发送响应消息。
HTTP/1.0的响应消息格式如下：

　　响应消息=状态行(通用信息头|响应头|实体头) CRLF　〔实体内容〕
　　状态行=HTTP版本号　状态码　原因叙述
　　状态码表示响应类型
1××　　保留
2××　　表示请求成功地接收
3××　　为完成请求客户需进一步细化请求
4××　　客户错误
5××　　服务器错误
　　响应头的信息包括：服务程序名，通知客户请求的URL需要认证，请求的资源何时能使用。
4.关闭连接
　　客户和服务器双方都可以通过关闭套接字来结束TCP/IP对话

HTTP和WWW的配置注意事项

一、HTTP的安全因素
对于HTPP要关注的两个基本安全情况之一是，一个恶意的客户能对HTTP服务器做些什么。在大多数情况
下，我们对HTTP服务器安全性的考虑同我们对其他服务器如匿名FTP服务器处理来自因特网的连接的安全性考虑
是一样的。你要确保用户的这些连接只能访问到你提供给他们访问的信息，并且不能让他们欺骗你的服务器来
获得他们不应得到的信息。
有许多种方法完成这个目标，包括：
1）仔细配置你的服务器中的安全及访问控制功能，来限制哪些用户可以访问服务器及他们能访问的区域。
2）以一个非特权用户来运行服务器。
3）使用CHROOT机制来限制服务器操作是在你的文件系统中的一个特定区域中，你以在服务器内或通过一
个外部交换程序来使用CHROOT。
4）不要将要保密信息放在服务器的机器上，这样的话，即使有人入侵到你的服务器上，由于那里没有他们
所感兴趣的东西，至少是没有他们无法从正常渠道得到的信息。5）对于你的网络中蓁机器进行安全配置以便
即使有人入侵的话，也只限于是该服务器这台机器，他们也难以进一步从你的网络中得到更多的信息。要这样
做的话首先必须不能将服务器运行在内部网络中。
HTTP服务器本身只提供有限的服务，没有许多要关心的安全问题。但在HTTP服务器你要担心的唯一功能
是：它能使用外部程序，特别是能通过CGI（公共网关接口COMMONGATEWAYINTERFACE）与用户交互，CGI是
HTTP提供用户信息如何与服务器连接并通过它传递给外部程序的一个功能。许多HTTP服务器配置成自动运行外
部程序来生成HTML页面。这些程序通常称为CGI程序，甚至它们所使用的CGI并不是程序。如果有人向HTTP服务
器发出一个数据查询要求，HTTP服务器执行一个外部程序来执行这个查询要求并生成HTML页面来作为回答。
有两个理由需要对外部程序的安全性担心的：
1）入侵者能不能欺骗外部程序去做一些它们不应做的事？
2）入侵者能不能上载他们自己的外部程序并执行它们？
你可能要在MACINTOSH、DOS和WINDOWS机器上HTTP服务器，这些机器有好的HTTP服务器但通常没有其他的
功能如保密。由于它们不能运行其他服务，没有强有力的外部程序能力。它们越简单，处理安全的能力就越
弱。

利用HTTP协议的特性进行拒绝服务攻击的一些构思

在介绍这个方法之前，让我们复习一下HTTP是怎样工作的：
　　由于HTTP协议是基于请求/响应范式的（相当于客户机/服务器）。一个客户机与服务器建立连接后，发送一个请求给服务器，请求方式的格式为：统一资源标识符(URL)、协议版本号，后边是MIME信息包括请求修饰符、客户机信息和可能的内容。服务器接到请求后，给予相应的响应信息，其格式为一个状态行，包括信息的协议版本号、一个成功或错误的代码，后边是MIME信息包括服务器信息、实体信息和可能的内容。
留意这行文字：“服务器接到请求后，给予相应的响应信息，其格式为一个状态行”，这是HTTP协议的一个重要特性，我们可以做个实验：
用TELNET或任何一个能建立HTTP连接的程序连接到某服务器的80端口，手工输入：
GET/index.htmHTTP/1.0（必须确保这个工具能自动产生两个换行符，否则服务器会认为你没有输入完全！）
如果index.htm存在，你会看到类似以下的报文：
HTTP/1.1200OK
Server:Microsoft-IIS/5.0
Content-Location:http://www.******.com/index.htm
Date:Sat,20Jul200223:32:03GMT
Content-Type:text/html
Accept-Ranges:bytes
Last-Modified:Wed,03Jul200209:50:05GMT
ETag:"8e2ba27722c21:850"
Content-Length:3292
<html>
<head>
<title>青涩宝贝主题站－－SGfans的世界！！！</title>
<metahttp-equiv="Content-Type"content="text/html;charset=gb2312">
<linkrel="stylesheet"href="all.css"type="text/css">
.......
这是正常的访问方法，但是如果我们胡乱输入请求呢？看：
HTTP/1.1400BadRequest
Server:Microsoft-IIS/5.0
Date:Sat,20Jul200223:37:59GMT
Content-Type:text/html
Content-Length:87
<html><head><title>Error</title></head><body>Theparameterisincorrect.</body></html>
呵呵，HTTP400-错误请求，其实就是HTTP语法错误，服务器老老实实给我们返回了。
可以得出结论：无论你输入了什么，服务器根据HTTP协议，总会返回信息
通常用得最多的DOS方法主要有SYN、Smurf、Land、TearDrop等，其中SYN的资料如下（抄来的资料~~呵呵）假设一个用户向服务器发送了SYN报文后突然死机或掉线，那么服务器在发出SYN+ACK应答报文后是无法收到客户端的ACK报文的（第三次握手无法完成），这种情况下服务器端一般会重试（再次发送SYN+ACK给客户端）并等待一段时间后丢弃这个未完成的连接，这段时间的长度我们称为SYNTimeout，一般来说这个时间是分钟的数量级（大约为30秒-2分钟）；一个用户出现异常导致服务器的一个线程等待1分钟并不是什么很大的问题，但如果有一个恶意的攻击者大量模拟这种情况，服务器端将为了维护一个非常大的半连接列表而消耗非常多的资源----数以万计的半连接，即使是简单的保存并遍历也会消耗非常多的CPU时间和内存，何况还要不断对这个列表中的IP进行SYN+ACK的重试。实际上如果服务器的TCP/IP栈不够强大，最后的结果往往是堆栈溢出崩溃---即使服务器端的系统足够强大，服务器端也将忙于处理攻击者伪造的TCP连接请求而无暇理睬客户的正常请求（毕竟客户端的正常请求比率非常之小），此时从正常客户的角度看来，服务器失去响应，这种情况我们称作：服务器端受到了SYNFlood攻击（SYN洪水攻击）。
而Smurf、TearDrop等是利用ICMP报文来Flood和IP碎片攻击的。
但是以上的DOS方法的目的无非都是让服务器大量消耗资源和超时连接，那么除了超时连接，能不能用“正常连接”的方法来产生拒绝服务攻击呢？
再来看看19端口的定义：
字符产生器协议（CharacterGeneratorProtocol）
字符产生器服务器一个有用的调试工具。无论接收到的是什么，它都返回特定的数据。
基于TCP的字符产生器服务
此服务可以是一个基于TCP的服务，TCP端口19是用于此服务的。一旦连接建立，服务器会传送一个字符流。接收到的信息会被抛弃。字符流会在用户请求下中止。用户可能会非正常中止一个连接，因此此服务必须准备处理这种情况。传输的速度会由TCP流控制机制负责，用户不必关心数据太快，而用户来不及处理。
19端口在早期已经有人用来做Chargen攻击了，即Chargen_Denial_of_Service，但是！他们用的方法是在两台Chargen服务器之间产生UDP连接，让服务器处理过多信息而DOWN掉，那么，干掉一台WEB服务器的条件就必须有2个：1.有Chargen服务2.有HTTP服务
实际上，现在是无法找到这么多同时开放两个这两个服务的服务器的。
看看开头的HTTP协议特性，和Chargen比较一下，你发现了什么？哈哈~~~没错！一个是无论接收到什么报文都会回应，一个是一旦连接建立就会发送报文，看看示意图：
发送请求------------------------------------->
客户端----------------------------------------------------------服务器
<-------------------------------------------回应
如果把客户端改为Chargen，就是以下情况：
字符流--------------------------------------->
Chargen----------------------------------------------------------服务器
<-----------------------------------400BadRequest
也就是说，这两者会产生利害冲突，可以这样比喻：两个人吵架，你骂一句，他还一句，这就是循环过程，除非有一方停止或第三者干涉，否则这将是个Do...Loop循环！
搬到HTTP和Chargen来说，就是因为这两者的特性正好天生一对，那好，就从这里下手：
攻击者伪造源IP给N台Chargen发送连接请求（Connect），如有必要还可以发送（Send）个“Fuckyou”报文过去，Chargen接收到连接后就会返回每秒72字节的字符流（实际上根据网络实际情况，这个速度更快）给服务器，HTTP协议处理这个报文时当然会识别为400BadRequest而返回一条错误说明给它，接下来的情况嘛………………自己发挥想像力，别问我。
我用自己的机器（640kbpsADSL）+VBWinsock程序做测试，只用了3秒钟，程序就因为内存溢出而崩溃了主要是TextBox的问题，它接受文本的最大范围为64KB），就是说，3秒钟内Chargen就发送了大于64KB的字符流！如果用大于10台的Chargen一起发起攻击，其速度足以大量消耗服务器资源和带

5.2.2 实例——基于vC++的HTTP蓉户端程序

应用层位于TCP/IP协议栈的最上层，它是网络应用程序及其应用层协议保存的地方。应用层向使用网络的用户提供特定的、常用的应用程序，如使用最广泛的远程登录协议Telnet、文件传输协议FTP、超文本传输协议HTTP、域名系统DNS、简单网络管理协议SNMP、P2p文件共享系统和简单邮件传输协议SMTP等.网络应用程序3种主要体系结构：客户机/服务器体系结构，P2P体系结构、客户机/服务器和P2P混合的体系结构.

有些应用层协议是基于TCP协议的，如FTP和HTTP,有些应用层协议是基于UDP协议的，如SMTP等。应用层协议定义了运行在不同端系统上的应用程序进程是如何相互传递报文的，特别是应用层协议定义了:

(1)交换的报文类型，如请求报文和相应报文。

(2)各种报文类型的语法,如报文的各个字段及其详细描述.

(3)字段的语义，即包含在字段中的信息的含义

(4)进程何时、如何发送报文及对报文进行响应.

HTTP协议即超文本传输协议(HyperText Transfer Protocol)，它是一个面向无连接的简单快速C/S结构的协议，HTTP是一个属于应用层的面向对象的协议，由于其简捷、快速的方式，适用于分布式超媒体信息系统。

HTTP协议是基于请求/响应范式的。一个客户机与服务器建立连接后，发送一个请求给服务器，请求方式的格式为统一资源标识符、协议版本号，后边是MIME信息包括请求修饰符、客户机信息和可能的内容。服务器接到请求后，给予相应的响应消息，其格式为一个状态行包括信息的协议版本号、一个成功或错误的代码，后边是MIME信息包括服务器信息，实体信息和可能的内容。

HTTP协议的内部操作过程分为4个过程,建立连接、发送请求信息、发送响应消息、关闭连接,在WWW中，"客户"与"服务器"是一个相对的概念，只存在于一个特定的连接期间，即在某个连接中的客户在另一个连接中可能作为服务器。WWW服务器运行时，一般在TCP80端口(WWW的默认端口)监听，等待连接的出现，下面，讨论HTTP协议下客户/ 服务器模式中信息交换的实现.

(1)建立连接:连接的建立是通过申请套接字(Socket)实现的。客户打开一个套接字并把它绑定在一个端口上，这样就可以建立客户机与服务器的TCP连接

(2)发送请求:客户机与服务器建立连接后，客户机把请求信息送服务器的监听端口上,消息中含有资源在服务器上的位置，完成提出请求动作

(3)发送响应:服务器在处理完客户的请求之后,要向客户机发送响应消息,消息中含有返回状态码,表示请求是否完成;包含相应消息标题和请求的对象实体,如一个HTTP文件或者一个图片

(4)关闭连接:一旦响应消息发出,服务器将关闭TCP/IP 连接，然后结束HTTP会话，客户和服务器双方都可以通过关闭套接字来结束TCP/IP对话

客户端HTTP请求的方法:GET,HEAD,POST,PUT,DELETE,OPTIONS,TRAC

该实例直接调用类库中的CHtmlView类，CHtmlView类在文档/视图结构的上下文中提供WebBrowser控件的功能。WebBrowser控件是客户可浏览网址以及本地文件系统和网络文件夹的窗口。WebBrowser控件支持超级链接、统一资源定位符(URL)导航器比维护一张历史表.，所以在创建程序的时候MFCAppWizard,并将CHtmlView 指定为视图类.

下面是用到的函数

//刷新当前的页面

void CMywebView::OnRefresh()

{