新浪微博 Github

Web资源访问及HTTP协议详解

 

下图为在浏览器中输入URL 后的一系列过程:

 

 

从此图中可以总结出几条结论:

1. 如果DNS服务器坏了,可以直接通过ip地址访问网页,因为DNS只是一个域名和IP地址的MAP;

通过在命令行中输入 “ping 域名”即可;

比如:

在命令行中输入 ping www.baidu.com  ,则出现如下文字:

 

 

 

可以看出 www.baidu.com 的ip地址是119.75.217.56 ;

直接在浏览器中输入 119.75.217.56  即可访问baidu;

2.Host文件位于   C:\Windows\System32\drivers\etc\hosts

此文件的用途:外挂,将游戏升级程序访问的服务器IP改成自己的机器的IP;  再比如优酷等视频网站去除广告就是通过此种方法;

在此文件中修改映射关系可以改变访问的效果,比如在文件中添加:

127.0.0.1     www.sina.com

则打开tomcat;

在浏览器中输入 http://www.sina.com:8080 可以看到tomcat的主页;

因为在访问DNS服务器之前ie会去访问 Hosts文件,如果存在映射关系,则不会去访问DNS服务器;

3.访问静态资源之前其实会访问默认Servlet,如果自己覆盖默认的Servlet,则不能正常访问到静态资源;

覆盖默认Servlet只需要<url-pattern>/</url-Pattern即可;

4.发送HTTP请求的前提是连接服务器;

 



HTTP协议总结

HTTP协议一般是隐藏在浏览器背后的,如果要查看HTTP协议内容,则需要下载IE插件 HTTPWATCH;

下载地址: http://www.99d.com/down/32/490672.html

HTTP协议时平台无关的;

HTTP由HTTP请求和HTTP响应组成;

 

1.HTTP请求

 

一般的HTTP请求如下:

 

1.1请求行

 

请求行是由 请求方式、请求资源、请求协议组成;

 

1.1.1请求方式

 

    请求方式主要有GET和POST两种; 

除了表单提交,其他都是GET请求;

 

一共有八种请求方式:

 请求方式 作用 
 get  用于请求某个资源,理论上不修改服务器的状态
 post  表单提交
 head  只返回get请求后相应的头,而不用吧相应体(HTML)返回
 trace  显示服务器端接收的信息,用于调试
 put  将包含的信息放在URL中
 delete  指明要删除某个URL对应的资源
 options  列出HTTP方法列表
 connect  建立隧道

 

 


幂等:一次请求和多次请求的结果是一样的;

在请求方式中,满足幂等的有:HEAD、GET、PUT;其余的都不是幂等;

 


 

1.1.2请求资源

 

    请求资源是要请求返回的web资源;

 

1.1.3请求协议

 

    请求协议现在一般使用HTTP/1.1,以前使用HTTP/1.0

注意:HTTP/1.1和HTTP/1.0的区别

HTTP是基于TCP/IP之上的,HTTP/1.0是指连接web服务器后只允许一次HTTP请求;HTTP/1.1是指连接web服务器后允许多次HTTP请求;

 

1.2请求头

 

请求头是由很多Map组成;

Host 客户机向服务器发送请求的主机名
Accept 客户机支持的数据类型
Accept-Language

客户机支持的语言

Tips:在访问www.google.com 时服务器会解析出客户机支持的语言,然后发回此语言的网页;

Accept-Charset 客户机支持的编码
Accept-Encoding 客户机的压缩格式
Referer

客户机访问此资源的来源;比如从1.html中的超链接请求2.html,则请求2.html时会发送Referer: 1.html

用途:防盗链

  避免从未知网站链接此网站,盗用资源

User-Agent 客户机的软件环境
Connection 客户机发送此连接后的连接状态时继续连接还是断开
Date 客户机发送的时间

 

注意:请求头和实际内容中间需要加上空行;

 

2.HTTP响应 

 

 

2.1 响应行

 

2.2.1 状态码

 

100-199 服务器成功接收客户请求,不过需要让客户机继续发送请求完成整个请求过程
200-299 200 成功处理
300-399 302 : 找别人,在响应头中需要有location属性;    304、307:找缓存,即缓存中存在页面
400-499 403:存在页面,但是用户没有权限访问;    404:无此页面
500-599 500 : 服务器内部错误

 

2.2 响应头

Server 服务器信息
Content-Length 响应内容的长度
Content-Encoding 服务器内容的压缩格式
Content-Type 服务器内容的格式,比如text/html ; image/jpeg
location

用于状态码为302,表示别人的地址

Content-disposition 下载返回的数据
Transfer-Encoding 以块传输还是以字节传输
Date 时间
refresh 定时刷新或重定向
Last-Modified 最后改变的时间
Expires -1或0 表示无缓存
ETag 每个web资源都有一个标示符,只要web资源内容改动,标示符就会改变;

 

应用1:location重定向

 

response.setStatus(302);

response.setHeader("location","http://localhost:8080/a/1.html");

 

应用2:content-Encoding  压缩数据

 

response.setHeader("content-encoding","gzip");

ByteArrayOutputStream bout = new ByteArrayOutputStream();

GZIPOutputStream out = new GZIPOutputStream(bout);

out.write("Hello".getBytes());

out.close();

byte[] b = bout.toByteArray();

response.getOutputStream().write(b);


 

电信对于网站的收费是按照出口流量收费的,因此需要压缩数据,减少费用;

 

应用3:content-disposition  

 

response.setHeader("content-disposition","attachment;filename=1.jpg");

 

应用4:refresh

 

response.setHeader("refresh","3");  定时更新 用于实时软件

response.setHeader("refresh","3;url='http://localhost:8080/1.html'");  注册登录

 

应用5:content-type   返回的数据类型;

 

public void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
		response.setHeader("content-type", "image/ipeg");
		InputStream in = this.getServletContext().getResourceAsStream("/1.jpg");
		java.io.OutputStream out = response.getOutputStream();
		byte[]b = new byte[1024];
		int length = 0;
		while((length=in.read(b))>0){
			out.write(b, 0, length);
		}
		out.close();
	
	}


 

 

 

posted @ 2012-01-25 22:59  xiazdong  阅读(524)  评论(0编辑  收藏  举报