老杜 JavaWeb 讲解（八） ——HTTP协议简单了解

(十)HTTP协议

对应视频：

17-HTTP协议详解

18-GET和POST的区别

10.1 什么是协议？

协议实际上是某些人，或者某些组织提前制定好的一套规范，大家都按照这个规范来，这样可以做到沟通无障碍。
协议就是一套规范，就是一套标准。由其他人或其他组织来负责制定的。
我说的话你能听懂，你说的话，我也能听懂，这说明我们之间是有一套规范的，一套协议的，这套协议就是：中国普通话协议。我们都遵守这套协议，我们之间就可以沟通无障碍。

10.2 什么是HTTP协议？

HTTP协议：是W3C制定的一种超文本传输协议。（通信协议：发送消息的模板提前被制定好。）
W3C：
- 万维网联盟组织
- 负责制定标准的：HTTP HTML4.0 HTML5 XML DOM等规范都是W3C制定的。
- 万维网之父：蒂姆·伯纳斯·李 (创办者)
超文本:
- 超文本说的就是：不是普通文本，比如流媒体：声音、视频、图片等。
- HTTP协议支持：不但可以传送普通字符串，同样支持传递声音、视频、图片等流媒体信息。
这种协议游走在B和S之间。B向S发数据要遵循HTTP协议。S向B发数据同样需要遵循HTTP协议。这样B和S才能解耦合。
什么是解耦合？
- B不依赖S。
- S也不依赖B。
什么是B/S？
- B/S结构的系统（浏览器访问WEB服务器的系统）
- 浏览器向 WEB服务器发送数据，叫做：请求（request)
- WEB服务器向浏览器发送数据，叫做：响应（response）
HTTP协议包括请求协议和响应协议
请求协议
- 浏览器向 WEB服务器发送数据的时候，这个发送的数据需要遵循一套标准，这套标准中规定了发送的数据具体格式。
响应协议
- WEB服务器向浏览器发送数据的时候，这个发送的数据需要遵循一套标准，这套标准中规定了发送的数据具体格式。
HTTP协议就是提前制定好的一种消息模板。
- 不管你是哪个品牌的浏览器，都是这么发。
- 不管你是哪个品牌的WEB服务器，都是这么发。
- FF浏览器可以向 Tomcat发送请求，也可以向Jetty服务器发送请求。浏览器不依赖具体的服务器品牌。
- WEB服务器也不依赖具体的浏览器品牌。可以是FF浏览器，也可以是Chrome浏览器，可以是IE，都行。

10.3 什么是HTTP请求协议？

HTTP的请求协议包括：4部分
- 请求行
- 请求头
- 空白行
- 请求体

HTTP请求协议具体报文：GET

GET /s5/GetServlet?username=jack&userpwd=123 HTTP/1.1
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9
Connection: keep-alive
Cookie: JSESSIONID=C474E84D95FD363289A6EDC5042DDDD3
Host: localhost:8080
Referer: http://localhost:8080/s5/
Sec-Fetch-Dest: document
Sec-Fetch-Mode: navigate
Sec-Fetch-Site: same-origin
Sec-Fetch-User: ?1
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36
sec-ch-ua: "Not.A/Brand";v="8", "Chromium";v="114", "Google Chrome";v="114"
sec-ch-ua-mobile: ?0
sec-ch-ua-platform: "Windows"

分析：

GET /s5/GetServlet?username=jack&userpwd=123 HTTP/1.1
这是请求行，表示使用 GET 方法请求 /s5/GetServlet 资源，同时传递了两个参数 username 和 userpwd。
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7
表示客户端可以接受的响应内容类型及其权重，按照权重从高到低排列。在此示例中，客户端首选的内容类型是 text/html，然后是 application/xhtml+xml，以此类推。
Accept-Encoding: gzip, deflate, br
表示客户端可以接受的响应内容编码方式。在此示例中，客户端可以接受的编码方式包括 gzip、deflate 和 br（Brotli）。
Accept-Language: zh-CN,zh;q=0.9
表示客户端可以接受的响应内容语言，按照权重从高到低排列。在此示例中，客户端首选的语言是中文（中国大陆），然后是中文（通用）。
Connection: keep-alive
表示客户端希望保持与服务器的长连接，以便进行多个请求和响应。
Cookie: JSESSIONID=C474E84D95FD363289A6EDC5042DDDD3
表示请求中包含的 cookie 信息。在此示例中，JSESSIONID 是 cookie 的名称，C474E84D95FD363289A6EDC5042DDDD3 是该 cookie 的值。
Host: localhost:8080
表示请求的目标主机和端口号。
Referer: http://localhost:8080/s5/
表示请求的来源页面 URL，即之前页面的 URL。
Sec-Fetch-Dest: document
Sec-Fetch-Mode: navigate
Sec-Fetch-Site: same-origin
Sec-Fetch-User: ?1
这些字段是用于支持 Fetch API 的一组安全头部，用于描述请求的上下文和性质。
Upgrade-Insecure-Requests: 1
表示客户端希望将不安全的 HTTP 请求升级为安全的 HTTPS 请求。
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36
表示发送请求的客户端浏览器和操作系统信息。在此示例中，是在 Windows 10 上使用 Chrome 浏览器进行请求。
sec-ch-ua: "Not.A/Brand";v="8", "Chromium";v="114", "Google Chrome";v="114"
表示用户代理的原始信息，用于标识浏览器和操作系统。此示例中使用的是不属于任何品牌的浏览器和 Chromium 内核。
sec-ch-ua-mobile: ?0
表示用户代理是否在移动设备上，此示例中不是移动设备。
sec-ch-ua-platform: "Windows"
表示用户代理的平台信息，在此示例中是 Windows 操作系统。

HTTP请求协议具体报文：POST

POST /s5/PostServlet HTTP/1.1
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9
Cache-Control: max-age=0
Connection: keep-alive
Content-Length: 24
Content-Type: application/x-www-form-urlencoded
Cookie: JSESSIONID=C474E84D95FD363289A6EDC5042DDDD3; b-user-id=e4b47408-2e2c-6053-eb41-b9eb4a54dff1
Host: localhost:8080
Origin: http://localhost:8080
Referer: http://localhost:8080/s5/
Sec-Fetch-Dest: document
Sec-Fetch-Mode: navigate
Sec-Fetch-Site: same-origin
Sec-Fetch-User: ?1
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36
sec-ch-ua: "Not.A/Brand";v="8", "Chromium";v="114", "Google Chrome";v="114"
sec-ch-ua-mobile: ?0
sec-ch-ua-platform: "Windows"

username=123&userpwd=123

请求行由三部分组成：请求方式、URI、HTTP协议版本号。
- 请求方式（7种）
  - get（常用的）
  - post（常用的）
  - delete
  - put
  - head
  - options
  - trace
- URI
  - 什么是URI（Uniform Resource Identifier）？统一资源标识符。代表网络中某个资源的名字。但是通过URI是无法定位资源的。
  - 什么是URL（Uniform Resource Locator）？统一资源定位符。代表网络中某个资源，同时，通过URL是可以定位到该资源的。
  - URI和URL什么关系，有什么区别？
    - URL包括URI
    - http://localhost:8080/s5/index.jsp 这是URL。
    - /s5/index.jsp这是URI。
- HTTP协议版本号
请求头
- 请求的主机
- 主机的端口
- 浏览器信息
- 平台信息
- cookie等信息
- ....
空白行
- 空白行是用来区分“请求头”和“请求体”
请求体
- 向服务器发送的具体数据。

10.4 什么是HTTP响应协议？

HTTP的响应协议包括：4部分
- 状态行
- 响应头
- 空白行
- 响应体

HTTP响应协议具体报文：GET

//状态行
HTTP/1.1 200 ok
//响应头
Content-Type: text/html;charset=UTF-8
Content-Length: 165
Date: Sat, 08 Jul 2023 09:55:31 GMT
Keep-Alive: timeout=20
Connection: keep-alive
//空白行

// 响应体
<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>from get servlet</title>
</head>
<body>
      <h1>from get servlet</h1>
</body>
</html>

HTTP响应协议具体报文：POST
```
//状态行
HTTP/1.1 200
//响应头
Content-Type: text/html;charset=UTF-8
Content-Length: 167
Date: Sat, 08 Jul 2023 10:16:54 GMT
Keep-Alive: timeout=20
Connection: keep-alive
//空白行

// 响应体
<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>from post servlet</title>
</head>
<body>
      <h1>from post servlet</h1>
</body>
</html>
```
- 状态行由三部分组成：协议版本号、状态码、状态描述信息。
  - 协议版本号 HTTP/1.1
  - 状态码：
    - 200 响应成功，正常结束。
    - 404 表示访问的资源不存在，通常是因为要么是你路径写错了，要么是路径写对了，但是服务器中对应的资源并没有启动成功。总之404错误是前端错误。
    - 405表示前端发送的请求方式与后端请求的处理方式不一致时发生：
      - 比如：前端是POST请求，后端的处理方式按照get方式进行处理时，发生405
      - 比如：前端是GET请求，后端的处理方式按照post方式进行处理时，发生405
    - 500表示服务器端的程序出现了异常。一般会认为是服务器端的错误导致的。
    - 以4开始的，一般是浏览器端的错误导致的。
    - 以5开始的，一般是服务器端的错误导致的。
  - 第三部分：状态的描述信息
    - ok 表示正常成功结束。
    - not found 表示资源找不到。
- 响应头
  - 响应的内容类型
  - 响应的内容长度
  - 响应的时间
  - ....
- 空白行
  - 用来分隔“响应头”和“响应体”的。
- 响应体
  - 响应体就是响应的正文，这些内容是一个长的字符串，这个字符串被浏览器渲染，解释并执行，最终展示出效果。

10.5 GET请求和POST请求有什么区别？

get请求发送数据的时候，数据会挂在URI的后面，并且在URI后面添加一个“?”，"?"后面是数据。这样会导致发送的数据回显在浏览器的地址栏上。（get请求在“请求行”上发送数据）
http://localhost:8080/s5/GetServlet?username=123&userpwd=123
post请求发送数据的时候，在请求体当中发送。不会回显到浏览器的地址栏上。也就是说post发送的数据，在浏览器地址栏上看不到。（post在“请求体”当中发送数据）
get请求只能发送普通的字符串。并且发送的字符串长度有限制，不同的浏览器限制不同。这个没有明确的规范。
get请求无法发送大数据量。
post请求可以发送任何类型的数据，包括普通字符串，流媒体等信息：视频、声音、图片。
post请求可以发送大数据量，理论上没有长度限制。
get请求在W3C中是这样说的：get请求比较适合从服务器端获取数据。
post请求在W3C中是这样说的：post请求比较适合向服务器端传送数据。
get请求是安全的。get请求是绝对安全的。为什么？因为get请求只是为了从服务器上获取数据。不会对服务器造成威胁。（get本身是安全的，你不要用错了。用错了之后又冤枉人家get不安全，你这样不好（太坏了），那是你自己的问题，不是get请求的问题。）
post请求是危险的。为什么？因为post请求是向服务器提交数据，如果这些数据通过后门的方式进入到服务器当中，服务器是很危险的。另外post是为了提交数据，所以一般情况下拦截请求的时候，大部分会选择拦截（监听）post请求。
get请求支持缓存。
任何一个get请求最终的“响应结果”都会被浏览器缓存起来。在浏览器缓存当中：
- 一个get请求的路径a 对应一个资源。
- 一个get请求的路径b 对应一个资源。
- 一个get请求的路径c 对应一个资源。
- ......
实际上，你只要发送get请求，浏览器做的第一件事都是先从本地浏览器缓存中找，找不到的时候才会去服务器上获取。这种缓存机制目的是为了提高用户的体验。
有没有这样一个需求：我们不希望get请求走缓存，怎么办？怎么避免走缓存？我希望每一次这个get请求都去服务器上找资源，我不想从本地浏览器的缓存中取。
- 只要每一次get请求的请求路径不同即可。
- https://n.sinaimg.cn/finance/590/w240h350/20211101/7cabc342ff5b9dc018b4b00cc.jpg?t=789789787897898
- https://n.sinaimg.cn/finance/590/w240h350/20211101/7cabc342ff5b9dc018b4b00cc.jpg?t=789789787897899
- https://n.sinaimg.cn/finance/590/w240h350/20211101/7cabc342ff5b9dc018b4b00cc.jpg?t=系统毫秒数
- 怎么解决？可以在路径的后面添加一个每时每刻都在变化的“时间戳”，这样，每一次的请求路径都不一样，浏览器就不走缓存了。
post请求不支持缓存。（POST是用来修改服务器端的资源的。）
- post请求之后，服务器“响应的结果”不会被浏览器缓存起来。因为这个缓存没有意义。
GET请求和POST请求如何选择，什么时候使用GET请求，什么时候使用POST请求？
- 怎么选择GET请求和POST请求呢？衡量标准是什么呢？你这个请求是想获取服务器端的数据，还是想向服务器发送数据。如果你是想从服务器上获取资源，建议使用GET请求，如果你这个请求是为了向服务器提交数据，建议使用POST请求。
- 大部分的form表单提交，都是post方式，因为form表单中要填写大量的数据，这些数据是收集用户的信息，一般是需要传给服务器，服务器将这些数据保存/修改等。
- 如果表单中有敏感信息，还是建议适用post请求，因为get请求会回显敏感信息到浏览器地址栏上。（例如：密码信息）
- 做文件上传，一定是post请求。要传的数据不是普通文本。
- 其他情况都可以使用get请求。
不管你是get请求还是post请求，发送的请求数据格式是完全相同的，只不过位置不同，格式都是统一的：
- name=value&name=value&name=value&name=value
  - name是什么？
    - 以form表单为例：form表单中input标签的name。
  - value是什么？
    - 以form表单为例：form表单中input标签的value。

补充

接触到的缓存机制：

堆内存当中的字符串常量池。
- "abc" 先在字符串常量池中查找，如果有，直接拿来用。如果没有则新建，然后再放入字符串常量池。
堆内存当中的整数型常量池。
- [-128 ~ 127] 一共256个Integer类型的引用，放在整数型常量池中。没有超出这个范围的话，直接从常量池中取。
连接池(Connection Cache)
- 这里所说的连接池中的连接是java语言连接数据库的连接对象：java.sql.Connection对象。
- JVM是一个进程。MySQL数据库是一个进程。进程和进程之间建立连接，打开通道是很费劲的。是很耗费资源的。怎么办？可以提前先创建好N个Connection连接对象，将连接对象放到一个集合当中，我们把这个放有Connection对象的集合称为连接池。每一次用户连接的时候不需要再新建连接对象，省去了新建的环节，直接从连接池中获取连接对象，大大提升访问效率。
- 连接池
  - 最小连接数
  - 最大连接数
  - 连接池可以提高用户的访问效率。当然也可以保证数据库的安全性。
线程池
- Tomcat服务器本身就是支持多线程的。
- Tomcat服务器是在用户发送一次请求，就新建一个Thread线程对象吗？
  - 当然不是，实际上是在Tomcat服务器启动的时候，会先创建好N多个线程Thread对象，然后将线程对象放到集合当中，称为线程池。用户发送请求过来之后，需要有一个对应的线程来处理这个请求，这个时候线程对象就会直接从线程池中拿，效率比较高。
  - 所有的WEB服务器，或者应用服务器，都是支持多线程的，都有线程池机制。
redis
- NoSQL数据库。非关系型数据库。缓存数据库。
向ServletContext应用域中存储数据，也等于是将数据存放到缓存cache当中了。