Java Web概述
JavaWeb概念
JavaWEB 是指所有通过 Java 语言编写可以通过浏览器访问的程序的总称。
什么是web应用? Web应用即网站中的程序。
常用软件体系结构
- C/S 客户端/服务器(Client/Server)
例如QQ;
需要编写服务器端程序,以及客户端程序,例如我们安装的就是QQ的客户端程序;
缺点:软件更新时需要同时更新客户端和服务器端两端,比较麻烦;
优点:安全性比较好。
- B/S 浏览器/服务器(Browser/Server)
优点:只需要编写服务器端程序;
缺点:安全性较差。
JavaWeb技术,所编写的web程序都是基于B/S结构的。
通信协议
URL地址
URL用于唯一标识它的访问位置,以便浏览器可以访问到,这个访问标记符称为URL(Uniform Resource Locator统一资源定位符)。
内容:
- Web服务器的主机名、
- 端口号、资源名
- 以及所使用的网络协议,
例如::http://www.itcast.cn:80/index.html
HTTP协议
HTTP协议是Hypertext Transfer Protocol的缩写,称为超文本传输协议。
它专门用于定义浏览器与Web服务器之间交换数据的格式。
浏览器与Web服务器之间使用HTTP协议实现通信的过程如下图所示。
web资源
放在Internet网上供外界访问的文件或程序被称作Web资源。
根据呈现的效果不同,Web资源可分为
-
静态web资源,比如说html,css,jpg
表现形式:内容是静态的,不同的人在不同的时间来访问时都是相同的内容。HTML、CSS、JS
所需技术:HTML+CSS -
动态web资源,比如说:JSP,Servlet
表现形式:内容是由程序生成的,不同的人在不同的时间访问的内容很可能是不同的。
所需技术:HTML、CSS、数据库技术、高级语言(Java、C#、PHP)、客户端脚本技术:JavaScript、XML解析
需要注意的是,动态的HTML页面并不是动态资源
因为:
- html是一个静态的Web资源,它的动态效果是浏览器执行脚本的结果。
- jsp是动态的Web资源,它的动态效果是由服务器程序实现的。
比如说:
如果分别用jsp和html实现显示当前时间,
在浏览器中查看dynamic.html的源文件时,发现其内容是固定不变的,
而dynamic.jsp的源文件内容却每次都不一样。
Web应用结构
什么是Web应用? 所谓Web应用就是多个Web资源的集合。
-
在Web服务器上运行的Web资源都是以Web应用形式呈现的。
-
一个Web应用由多个Web资源或其它文件组成,
其中包括html文件、css文件、js文件、动态web页面、java程序、支持jar包、配置文件等。
Web应用的目录结构
Web应用默认页面
当访问一个Web应用程序时,通常需要指定访问的资源名称,如果没有指定资源名称,则会访问默认的页面。
配置Web应用默认页面: 修改WEB-INF目录下的web.xml文件的配置
HTTP协议
HTTP是一种请求/响应式的协议,客户端在与服务器端建立连接后,
就可以向服务器端发送请求,这种请求被称作HTTP请求,
服务器端接收到请求后会做出响应,称为HTTP响应。
特点:
-
支持B/S及C/S模式
-
简单快速:客户向服务器请求服务时,只需传送请求方法和路径。
由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。 -
灵活:HTTP允许传输任意类型的数据。
正在传输的类型由Content-Type加以标记。 -
无状态:HTTP协议是无状态协议。
无状态是指协议对于事务处理没有记忆能力。
缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。
另一方面,在服务器不需要先前信息时它的应答就较快。
HTTP1.0和HTTP 1.1
HTTP协议的客户端有服务器的交互过程中需要经过建立连接,发送请求信息,回送响应信息,关闭连接四个步骤。
- HTTP1.0使用非持续连接:限制每次连接只处理一个请求,服务器处理完客户的请求,并收到客户的应答后,即断开连接。
- HTTP 1.1使用持续连接:不必为每个web对象创建一个新的连接,一个连接可以传送多个对象,采用这种方式可以节省传输时间。
因而对于下面代码:
<html>
<body>
<img src="/image01.jpg">
<img src="/image02.jpg">
<img src="/image03.jpg">
</body>
</html>
http1.0需要请求4次和响应4次。
http1.1需要请求4次和响应1次。
HTTP消息
HTTP请求消息和HTTP响应消息统称为HTTP消息
HTTP请求消息
当用户在浏览器中访问某个URL地址、单击网页的某个超链接等各种操作后,浏览器向服务器发送请求数据。
HTTP响应消息
服务器接收到请求数据后,回送给客户端处理后的数据。
请求消息
请求消息包括以下数据:
- 请求行
- 请求消息头
- 空行
- 请求数据
请求行
位于请求消息的第一行,包含三部分
- 请求方式
- 要访问的资源路径
- 所使用的HTTP版本(通信使用的协议版本)
例如:GET / HTTP/1.1
//GET说明请求类型为GET
//后面如果不为空,显示要访问的资源,
//通信使用的协议版本:HTTP1.1版本。
请求方式: 一共8种。
常用的有两种GET和POST。
-
GET:获取资源,可以理解为读取或者下载数据;
数据最大1K,无消息体,信息会体现在URL地址上明文显示
链接请求都是GET,地址栏的请求都是GET请求 -
POST:向资源提交数据,相当于写入或上传数据;
发送数据大小无限制,用于上传下载
请求消息头
请求行之后,便是若干个请求消息头。
请求消息头主要用于向服务器端传递附加消息
例如:
//Accept头字段用于指出客户端程序(通常是浏览器)能够处理的MIME(多用途互联网邮件扩展)类型。
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9
//Accept-Encoding头字段用于指定客户端能够进行解码的数据编码方式,这里的编码方式通常指的是某种压缩方式。
Accept-Encoding: gzip, deflate, br
//Accept-Language头字段用于指定客户端期望服务器返回哪个国家语言的文档,如果指定多个国家的语言,用逗号分隔
Accept-Language: zh-CN,zh;q=0.9
Host: localhost:8080
常见请求消息头
-
Host 表示服务器的域名以及服务器所监听的端口号。
如果所请求的端口是对应的服务的标准端口(80),则端口号可以省略。 -
Referer 表示浏览器所访问的前一个页面,也就是跳转本网站的上一个网站地址
Referer其实是Referrer这个单词,但RFC制作标准时给拼错了,后来也就将错就错使用Referer了。
常用于追踪网站的访问者是如何导航进入网站的和网站的防盗链
空行
请求头部后面的空行是必须的
即使第四部分的请求数据为空,也必须有空行。
请求数据
也叫主体,可以添加任意的其他数据。
响应信息
一般情况下,服务器接收并处理客户端发过来的请求后会返回一个HTTP的响应消息。
HTTP响应也由四个部分组成,分别是:
- 状态行
- 消息报头
- 空行
- 响应正文
响应状态行
HTTP响应状态行位于响应消息的第一行
它包括三个部分:
- HTTP协议版本
- 一个表示成功或错误的整数代码(状态码)
- 对状态码进行描述的文本信息。
例如:HTTP/1.1 200 OK
//HTTP/1.1)表明HTTP版本为1.1版本,状态码为200,状态消息为(ok)
状态码
状态码由3位数字组成,表示请求是否被理解或被满足。状态码的第一个数字表示响应的类别。
如下所示
1xx 信息响应。 收到并理解的请求。 请求处理将继续。
2xx 成功。 已成功接收、理解和接受该操作。
3xx 重定向。 客户端必须采取进一步操作才能完成请求。
4xx 客户端错误。 可能是客户端导致的错误。 ...
5xx 服务器错误。 服务器遇到错误,无法满足请求。
常见的状态码有:
-
状态代码 200 表输出服务器成功处理了客户端的请求。客户端的请求成功,响应消息返回正常的请求结果。
-
状态代码 302 可以简单的理解为该资源原本确实存在,但已经被临时改变了位置;换而言之,就是请求的资源暂时驻留在不同的URI下
-
状态代码 304 = 用于浏览器缓存的状态代码。
如果客户端有缓存的文件,他会在请求消息中附加if-Modified—Since请求头,
如果在指定时间之后响应尚未修改,则发送状态代码 304,客户端/用户可以继续使用相同的响应/缓存版本。
如果已修改,则发送状态代码 200 以及资源。 -
状态代码 404 = 当请求有效,但无法在服务器上找到资源。
例如: 访问服务器不存在的网页经常返回此状态码。 -
状态代码 500 – 当服务器由于意外问题无法完成请求时,将发生状态代码 500。
大部分情况下,是服务器端的CGI、ASP、JSP等程序发生了错误。Web 开发人员通常必须对服务器日志进行梳理,以确定问题的确切问题来自何处。
响应消息头
在HTTP响应消息中,第一行为响应状态行,紧接着的是若干响应消息头,
服务器端通过响应消息头向客户端传递附加信息。
例如:
Content-Encoding: gzip
Content-Type: text/html;charset=utf-8
Date: Mon, 13 Jun 2022 13:20:30 GMT
Expires: Mon, 13 Jun 2022 13:20:30 GMT
Server: BWS/1.1
常见响应消息头
-
Location:用于通知客户端获取请求文档的新地址。值是一个使用绝对路径的URL地址。
Location通常不是直接设置的,而是通过HttpServletResponse的sendRedirect方法,该方法同时设置状态代码为302,用于通知客户端自动连接到新的地址请求文档。 -
Refresh:通知浏览器应该在多少时间之后刷新页面,以秒为单位。除此之外还可以通过setHeader("Refresh", "time; URL=path")让浏览器在指定时间后转跳到指定的页面。
注意Refresh的意义是"N秒之后刷新本页面或访问指定页面",而不是"每隔N秒刷新本页面或访问指定页面"。
注意Refresh头不属于HTTP 1.1正式规范的一部分,而是一个扩展,但常用浏览器都支持它。
空行
消息报头后面的空行是必须的
响应正文
服务器返回给客户端的文本信息。
Tomcat
Tomcat是Apache组织,是Sun公司(已经被Oracle)的开源的运行Servlet和JSP的容器(引擎)。