老杜 JavaWeb 讲解(八) ——HTTP协议简单了解
(十)HTTP协议
对应视频:
10.1 什么是协议?
- 协议实际上是某些人,或者某些组织提前制定好的一套规范,大家都按照这个规范来,这样可以做到沟通无障碍。
- 协议就是一套规范,就是一套标准。由其他人或其他组织来负责制定的。
- 我说的话你能听懂,你说的话,我也能听懂,这说明我们之间是有一套规范的,一套协议的,这套协议就是:中国普通话协议。我们都遵守这套协议,我们之间就可以沟通无障碍。
10.2 什么是HTTP协议?
-
HTTP协议:是W3C制定的一种超文本传输协议。(通信协议:发送消息的模板提前被制定好。)
W3C:
-
万维网联盟组织
-
负责制定标准的:HTTP HTML4.0 HTML5 XML DOM等规范都是W3C制定的。
-
万维网之父:蒂姆·伯纳斯·李 (创办者)
超文本:
-
超文本说的就是:不是普通文本,比如流媒体:声音、视频、图片等。
-
HTTP协议支持:不但可以传送普通字符串,同样支持传递声音、视频、图片等流媒体信息。
-
-
这种协议游走在B和S之间。B向S发数据要遵循HTTP协议。S向B发数据同样需要遵循HTTP协议。这样B和S才能解耦合。
什么是解耦合?
- B不依赖S。
- S也不依赖B。
什么是B/S?
- B/S结构的系统(浏览器访问WEB服务器的系统)
- 浏览器 向 WEB服务器发送数据,叫做:请求(request)
- WEB服务器 向 浏览器发送数据,叫做:响应(response)
-
HTTP协议包括请求协议和响应协议
请求协议
- 浏览器 向 WEB服务器发送数据的时候,这个发送的数据需要遵循一套标准,这套标准中规定了发送的数据具体格式。
响应协议
- WEB服务器 向 浏览器发送数据的时候,这个发送的数据需要遵循一套标准,这套标准中规定了发送的数据具体格式。
-
HTTP协议就是提前制定好的一种消息模板。
- 不管你是哪个品牌的浏览器,都是这么发。
- 不管你是哪个品牌的WEB服务器,都是这么发。
- FF浏览器 可以向 Tomcat发送请求,也可以向Jetty服务器发送请求。浏览器不依赖具体的服务器品牌。
- WEB服务器也不依赖具体的浏览器品牌。可以是FF浏览器,也可以是Chrome浏览器,可以是IE,都行。
10.3 什么是HTTP请求协议?
-
HTTP的请求协议包括:4部分
- 请求行
- 请求头
- 空白行
- 请求体
-
HTTP请求协议具体报文:GET
GET /s5/GetServlet?username=jack&userpwd=123 HTTP/1.1 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7 Accept-Encoding: gzip, deflate, br Accept-Language: zh-CN,zh;q=0.9 Connection: keep-alive Cookie: JSESSIONID=C474E84D95FD363289A6EDC5042DDDD3 Host: localhost:8080 Referer: http://localhost:8080/s5/ Sec-Fetch-Dest: document Sec-Fetch-Mode: navigate Sec-Fetch-Site: same-origin Sec-Fetch-User: ?1 Upgrade-Insecure-Requests: 1 User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36 sec-ch-ua: "Not.A/Brand";v="8", "Chromium";v="114", "Google Chrome";v="114" sec-ch-ua-mobile: ?0 sec-ch-ua-platform: "Windows"
分析:
GET /s5/GetServlet?username=jack&userpwd=123 HTTP/1.1
这是请求行,表示使用 GET 方法请求
/s5/GetServlet
资源,同时传递了两个参数username
和userpwd
。
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7
表示客户端可以接受的响应内容类型及其权重,按照权重从高到低排列。在此示例中,客户端首选的内容类型是
text/html
,然后是application/xhtml+xml
,以此类推。Accept-Encoding: gzip, deflate, br
表示客户端可以接受的响应内容编码方式。在此示例中,客户端可以接受的编码方式包括
gzip
、deflate
和br
(Brotli)。
Accept-Language: zh-CN,zh;q=0.9
表示客户端可以接受的响应内容语言,按照权重从高到低排列。在此示例中,客户端首选的语言是中文(中国大陆),然后是中文(通用)。
Connection: keep-alive
表示客户端希望保持与服务器的长连接,以便进行多个请求和响应。
Cookie: JSESSIONID=C474E84D95FD363289A6EDC5042DDDD3
表示请求中包含的 cookie 信息。在此示例中,
JSESSIONID
是 cookie 的名称,C474E84D95FD363289A6EDC5042DDDD3
是该 cookie 的值。
Host: localhost:8080
表示请求的目标主机和端口号。
Referer: http://localhost:8080/s5/
表示请求的来源页面 URL,即之前页面的 URL。
Sec-Fetch-Dest: document Sec-Fetch-Mode: navigate Sec-Fetch-Site: same-origin Sec-Fetch-User: ?1
这些字段是用于支持 Fetch API 的一组安全头部,用于描述请求的上下文和性质。
Upgrade-Insecure-Requests: 1
表示客户端希望将不安全的 HTTP 请求升级为安全的 HTTPS 请求。
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36
表示发送请求的客户端浏览器和操作系统信息。在此示例中,是在 Windows 10 上使用 Chrome 浏览器进行请求。
sec-ch-ua: "Not.A/Brand";v="8", "Chromium";v="114", "Google Chrome";v="114"
表示用户代理的原始信息,用于标识浏览器和操作系统。此示例中使用的是不属于任何品牌的浏览器和 Chromium 内核。
sec-ch-ua-mobile: ?0
表示用户代理是否在移动设备上,此示例中不是移动设备。
sec-ch-ua-platform: "Windows"
表示用户代理的平台信息,在此示例中是 Windows 操作系统。
-
HTTP请求协议具体报文:POST
POST /s5/PostServlet HTTP/1.1 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7 Accept-Encoding: gzip, deflate, br Accept-Language: zh-CN,zh;q=0.9 Cache-Control: max-age=0 Connection: keep-alive Content-Length: 24 Content-Type: application/x-www-form-urlencoded Cookie: JSESSIONID=C474E84D95FD363289A6EDC5042DDDD3; b-user-id=e4b47408-2e2c-6053-eb41-b9eb4a54dff1 Host: localhost:8080 Origin: http://localhost:8080 Referer: http://localhost:8080/s5/ Sec-Fetch-Dest: document Sec-Fetch-Mode: navigate Sec-Fetch-Site: same-origin Sec-Fetch-User: ?1 Upgrade-Insecure-Requests: 1 User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36 sec-ch-ua: "Not.A/Brand";v="8", "Chromium";v="114", "Google Chrome";v="114" sec-ch-ua-mobile: ?0 sec-ch-ua-platform: "Windows" username=123&userpwd=123
-
请求行由三部分组成:请求方式、URI、HTTP协议版本号。
-
请求方式(7种)
- get(常用的)
- post(常用的)
- delete
- put
- head
- options
- trace
-
URI
- 什么是URI(Uniform Resource Identifier)? 统一资源标识符。代表网络中某个资源的名字。但是通过URI是无法定位资源的。
- 什么是URL(Uniform Resource Locator)?统一资源定位符。代表网络中某个资源,同时,通过URL是可以定位到该资源的。
- URI和URL什么关系,有什么区别?
- URL包括URI
- http://localhost:8080/s5/index.jsp 这是URL。
- /s5/index.jsp这是URI。
-
HTTP协议版本号
-
-
请求头
- 请求的主机
- 主机的端口
- 浏览器信息
- 平台信息
- cookie等信息
- ....
-
空白行
- 空白行是用来区分“请求头”和“请求体”
-
请求体
- 向服务器发送的具体数据。
-
10.4 什么是HTTP响应协议?
-
HTTP的响应协议包括:4部分
- 状态行
- 响应头
- 空白行
- 响应体
-
HTTP响应协议具体报文:GET
//状态行 HTTP/1.1 200 ok //响应头 Content-Type: text/html;charset=UTF-8 Content-Length: 165 Date: Sat, 08 Jul 2023 09:55:31 GMT Keep-Alive: timeout=20 Connection: keep-alive //空白行 // 响应体 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>from get servlet</title> </head> <body> <h1>from get servlet</h1> </body> </html>
-
HTTP响应协议具体报文:POST
//状态行 HTTP/1.1 200 //响应头 Content-Type: text/html;charset=UTF-8 Content-Length: 167 Date: Sat, 08 Jul 2023 10:16:54 GMT Keep-Alive: timeout=20 Connection: keep-alive //空白行 // 响应体 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>from post servlet</title> </head> <body> <h1>from post servlet</h1> </body> </html>
- 状态行由三部分组成:协议版本号、状态码、状态描述信息。
- 协议版本号 HTTP/1.1
- 状态码:
- 200 响应成功,正常结束。
- 404 表示访问的资源不存在,通常是因为要么是你路径写错了,要么是路径写对了,但是服务器中对应的资源并没有启动成功。总之404错误是前端错误。
- 405表示前端发送的请求方式与后端请求的处理方式不一致时发生:
- 比如:前端是POST请求,后端的处理方式按照get方式进行处理时,发生405
- 比如:前端是GET请求,后端的处理方式按照post方式进行处理时,发生405
- 500表示服务器端的程序出现了异常。一般会认为是服务器端的错误导致的。
- 以4开始的,一般是浏览器端的错误导致的。
- 以5开始的,一般是服务器端的错误导致的。
- 第三部分:状态的描述信息
- ok 表示正常成功结束。
- not found 表示资源找不到。
- 响应头
- 响应的内容类型
- 响应的内容长度
- 响应的时间
- ....
- 空白行
- 用来分隔“响应头”和“响应体”的。
- 响应体
- 响应体就是响应的正文,这些内容是一个长的字符串,这个字符串被浏览器渲染,解释并执行,最终展示出效果。
- 状态行由三部分组成:协议版本号、状态码、状态描述信息。
10.5 GET请求和POST请求有什么区别?
-
get请求发送数据的时候,数据会挂在URI的后面,并且在URI后面添加一个“?”,"?"后面是数据。这样会导致发送的数据回显在浏览器的地址栏上。(get请求在“请求行”上发送数据)
-
http://localhost:8080/s5/GetServlet?username=123&userpwd=123
-
post请求发送数据的时候,在请求体当中发送。不会回显到浏览器的地址栏上。也就是说post发送的数据,在浏览器地址栏上看不到。(post在“请求体”当中发送数据)
-
get请求只能发送普通的字符串。并且发送的字符串长度有限制,不同的浏览器限制不同。这个没有明确的规范。
-
get请求无法发送大数据量。
-
post请求可以发送任何类型的数据,包括普通字符串,流媒体等信息:视频、声音、图片。
-
post请求可以发送大数据量,理论上没有长度限制。
-
get请求在W3C中是这样说的:get请求比较适合从服务器端获取数据。
-
post请求在W3C中是这样说的:post请求比较适合向服务器端传送数据。
-
get请求是安全的。get请求是绝对安全的。为什么?因为get请求只是为了从服务器上获取数据。不会对服务器造成威胁。(get本身是安全的,你不要用错了。用错了之后又冤枉人家get不安全,你这样不好(太坏了),那是你自己的问题,不是get请求的问题。)
-
post请求是危险的。为什么?因为post请求是向服务器提交数据,如果这些数据通过后门的方式进入到服务器当中,服务器是很危险的。另外post是为了提交数据,所以一般情况下拦截请求的时候,大部分会选择拦截(监听)post请求。
-
get请求支持缓存。
-
任何一个get请求最终的“响应结果”都会被浏览器缓存起来。在浏览器缓存当中:
- 一个get请求的路径a 对应 一个资源。
- 一个get请求的路径b 对应 一个资源。
- 一个get请求的路径c 对应 一个资源。
- ......
-
实际上,你只要发送get请求,浏览器做的第一件事都是先从本地浏览器缓存中找,找不到的时候才会去服务器上获取。这种缓存机制目的是为了提高用户的体验。
-
有没有这样一个需求:我们不希望get请求走缓存,怎么办?怎么避免走缓存?我希望每一次这个get请求都去服务器上找资源,我不想从本地浏览器的缓存中取。
- 只要每一次get请求的请求路径不同即可。
- https://n.sinaimg.cn/finance/590/w240h350/20211101/7cabc342ff5b9dc018b4b00cc.jpg?t=789789787897898
- https://n.sinaimg.cn/finance/590/w240h350/20211101/7cabc342ff5b9dc018b4b00cc.jpg?t=789789787897899
- https://n.sinaimg.cn/finance/590/w240h350/20211101/7cabc342ff5b9dc018b4b00cc.jpg?t=系统毫秒数
- 怎么解决?可以在路径的后面添加一个每时每刻都在变化的“时间戳”,这样,每一次的请求路径都不一样,浏览器就不走缓存了。
-
post请求不支持缓存。(POST是用来修改服务器端的资源的。)
- post请求之后,服务器“响应的结果”不会被浏览器缓存起来。因为这个缓存没有意义。
-
GET请求和POST请求如何选择,什么时候使用GET请求,什么时候使用POST请求?
- 怎么选择GET请求和POST请求呢?衡量标准是什么呢?你这个请求是想获取服务器端的数据,还是想向服务器发送数据。如果你是想从服务器上获取资源,建议使用GET请求,如果你这个请求是为了向服务器提交数据,建议使用POST请求。
- 大部分的form表单提交,都是post方式,因为form表单中要填写大量的数据,这些数据是收集用户的信息,一般是需要传给服务器,服务器将这些数据保存/修改等。
- 如果表单中有敏感信息,还是建议适用post请求,因为get请求会回显敏感信息到浏览器地址栏上。(例如:密码信息)
- 做文件上传,一定是post请求。要传的数据不是普通文本。
- 其他情况都可以使用get请求。
-
不管你是get请求还是post请求,发送的请求数据格式是完全相同的,只不过位置不同,格式都是统一的:
- name=value&name=value&name=value&name=value
- name是什么?
- 以form表单为例:form表单中input标签的name。
- value是什么?
- 以form表单为例:form表单中input标签的value。
- name是什么?
- name=value&name=value&name=value&name=value
补充
接触到的缓存机制:
- 堆内存当中的字符串常量池。
- "abc" 先在字符串常量池中查找,如果有,直接拿来用。如果没有则新建,然后再放入字符串常量池。
- 堆内存当中的整数型常量池。
- [-128 ~ 127] 一共256个Integer类型的引用,放在整数型常量池中。没有超出这个范围的话,直接从常量池中取。
- 连接池(Connection Cache)
- 这里所说的连接池中的连接是java语言连接数据库的连接对象:java.sql.Connection对象。
- JVM是一个进程。MySQL数据库是一个进程。进程和进程之间建立连接,打开通道是很费劲的。是很耗费资源的。怎么办?可以提前先创建好N个Connection连接对象,将连接对象放到一个集合当中,我们把这个放有Connection对象的集合称为连接池。每一次用户连接的时候不需要再新建连接对象,省去了新建的环节,直接从连接池中获取连接对象,大大提升访问效率。
- 连接池
- 最小连接数
- 最大连接数
- 连接池可以提高用户的访问效率。当然也可以保证数据库的安全性。
- 线程池
- Tomcat服务器本身就是支持多线程的。
- Tomcat服务器是在用户发送一次请求,就新建一个Thread线程对象吗?
- 当然不是,实际上是在Tomcat服务器启动的时候,会先创建好N多个线程Thread对象,然后将线程对象放到集合当中,称为线程池。用户发送请求过来之后,需要有一个对应的线程来处理这个请求,这个时候线程对象就会直接从线程池中拿,效率比较高。
- 所有的WEB服务器,或者应用服务器,都是支持多线程的,都有线程池机制。
- redis
- NoSQL数据库。非关系型数据库。缓存数据库。
- 向ServletContext应用域中存储数据,也等于是将数据存放到缓存cache当中了。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?