Web资源访问及HTTP协议详解

下图为在浏览器中输入URL 后的一系列过程：

从此图中可以总结出几条结论：

1. 如果DNS服务器坏了，可以直接通过ip地址访问网页，因为DNS只是一个域名和IP地址的MAP；

通过在命令行中输入 “ping 域名”即可；

比如：

在命令行中输入 ping www.baidu.com ，则出现如下文字：

可以看出 www.baidu.com 的ip地址是119.75.217.56 ；

直接在浏览器中输入 119.75.217.56 即可访问baidu；

2.Host文件位于 C:\Windows\System32\drivers\etc\hosts

此文件的用途：外挂,将游戏升级程序访问的服务器IP改成自己的机器的IP; 再比如优酷等视频网站去除广告就是通过此种方法；

在此文件中修改映射关系可以改变访问的效果，比如在文件中添加：

127.0.0.1 www.sina.com

则打开tomcat；

在浏览器中输入 http://www.sina.com:8080 可以看到tomcat的主页；

因为在访问DNS服务器之前ie会去访问 Hosts文件，如果存在映射关系，则不会去访问DNS服务器；

3.访问静态资源之前其实会访问默认Servlet，如果自己覆盖默认的Servlet，则不能正常访问到静态资源；

覆盖默认Servlet只需要<url-pattern>/</url-Pattern> 即可；

4.发送HTTP请求的前提是连接服务器；

HTTP协议总结

HTTP协议一般是隐藏在浏览器背后的，如果要查看HTTP协议内容，则需要下载IE插件 HTTPWATCH；

下载地址： http://www.99d.com/down/32/490672.html

HTTP协议时平台无关的；

HTTP由HTTP请求和HTTP响应组成；

1.HTTP请求

一般的HTTP请求如下：

1.1请求行

请求行是由请求方式、请求资源、请求协议组成；

1.1.1请求方式

请求方式主要有GET和POST两种；

除了表单提交，其他都是GET请求；

一共有八种请求方式：

请求方式	作用
get	用于请求某个资源，理论上不修改服务器的状态
post	表单提交
head	只返回get请求后相应的头，而不用吧相应体（HTML）返回
trace	显示服务器端接收的信息，用于调试
put	将包含的信息放在URL中
delete	指明要删除某个URL对应的资源
options	列出HTTP方法列表
connect	建立隧道

幂等：一次请求和多次请求的结果是一样的；

在请求方式中，满足幂等的有：HEAD、GET、PUT;其余的都不是幂等；

1.1.2请求资源

请求资源是要请求返回的web资源；

1.1.3请求协议

请求协议现在一般使用HTTP/1.1，以前使用HTTP/1.0

注意：HTTP/1.1和HTTP/1.0的区别

HTTP是基于TCP/IP之上的，HTTP/1.0是指连接web服务器后只允许一次HTTP请求；HTTP/1.1是指连接web服务器后允许多次HTTP请求；

1.2请求头

请求头是由很多Map组成；

Host	客户机向服务器发送请求的主机名
Accept	客户机支持的数据类型
Accept-Language	客户机支持的语言 Tips：在访问www.google.com 时服务器会解析出客户机支持的语言，然后发回此语言的网页；
Accept-Charset	客户机支持的编码
Accept-Encoding	客户机的压缩格式
Referer	客户机访问此资源的来源；比如从1.html中的超链接请求2.html,则请求2.html时会发送Referer: 1.html 用途：防盗链避免从未知网站链接此网站，盗用资源
User-Agent	客户机的软件环境
Connection	客户机发送此连接后的连接状态时继续连接还是断开
Date	客户机发送的时间

注意：请求头和实际内容中间需要加上空行；

2.HTTP响应

2.1 响应行

2.2.1 状态码

100-199	服务器成功接收客户请求，不过需要让客户机继续发送请求完成整个请求过程
200-299	200 成功处理
300-399	302 ：找别人，在响应头中需要有location属性； 304、307：找缓存，即缓存中存在页面
400-499	403：存在页面，但是用户没有权限访问； 404：无此页面
500-599	500 ：服务器内部错误

2.2 响应头

Server	服务器信息
Content-Length	响应内容的长度
Content-Encoding	服务器内容的压缩格式
Content-Type	服务器内容的格式，比如text/html ; image/jpeg
location	用于状态码为302，表示别人的地址
Content-disposition	下载返回的数据
Transfer-Encoding	以块传输还是以字节传输
Date	时间
refresh	定时刷新或重定向
Last-Modified	最后改变的时间
Expires	-1或0 表示无缓存
ETag	每个web资源都有一个标示符，只要web资源内容改动，标示符就会改变；

应用1：location重定向

response.setStatus(302);

response.setHeader("location","http://localhost:8080/a/1.html");

应用2：content-Encoding 压缩数据

response.setHeader("content-encoding","gzip");

ByteArrayOutputStream bout = new ByteArrayOutputStream();

GZIPOutputStream out = new GZIPOutputStream(bout);

out.write("Hello".getBytes());

out.close();

byte[] b = bout.toByteArray();

response.getOutputStream().write(b);

电信对于网站的收费是按照出口流量收费的，因此需要压缩数据，减少费用；

应用3：content-disposition

response.setHeader("content-disposition","attachment;filename=1.jpg");

应用4：refresh

response.setHeader("refresh","3"); 定时更新用于实时软件

response.setHeader("refresh","3;url='http://localhost:8080/1.html'"); 注册登录

应用5：content-type 返回的数据类型；

public void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
		response.setHeader("content-type", "image/ipeg");
		InputStream in = this.getServletContext().getResourceAsStream("/1.jpg");
		java.io.OutputStream out = response.getOutputStream();
		byte[]b = new byte[1024];
		int length = 0;
		while((length=in.read(b))>0){
			out.write(b, 0, length);
		}
		out.close();
	
	}

posted @ 2012-01-25 22:59 xiazdong 阅读(524) 评论(0) 编辑收藏举报

刷新页面返回顶部

xiazdong