HTTP content-type及POST提交数据方式

Content-Type(内容类型),一般指网页中存在的Content-Type,用于定义网络文件的类型和网页的编码,决定浏览器将以什么形式、什么编码读取这个文件,这也是一些网页点击的结果却是一个文件或一张图片的原因。

Content-Type 是请求报文和响应报文的实体部分使用的头部,标识实际返回实体主体的媒体类型。

语法:

Content-Type: text/html; charset=utf-8
Content-Type: multipart/form-data; boundary=something

常见的媒体格式类型如下:

  • text/html : HTML格式
  • text/plain :纯文本格式
  • text/xml : XML格式
  • image/gif :gif图片格式
  • image/jpeg :jpg图片格式
  • image/png:png图片格式

以application开头的媒体格式类型:

  • application/xhtml+xml :XHTML格式
  • application/xml: XML数据格式
  • application/atom+xml :Atom XML聚合格式
  • application/json: JSON数据格式
  • application/pdf:pdf格式
  • application/msword : Word文档格式
  • application/octet-stream : 二进制流数据(如常见的文件下载)
  • application/x-www-form-urlencoded : <form encType=””>中默认的encType,form表单数据被编码为key/value格式发送到服务器(表单默认的提交数据的格式)

另外一种常见的媒体格式是上传文件之时使用的:

  • multipart/form-data : 需要在表单中进行文件上传时,就需要使用该格式

 

POST提交数据的方式

  1、application/x-www-form-urlencoded 

    在发送到服务器前,使用URL的percent-encoding(百分号编码)编码所有的字符。

    之所以叫百分号编码,是因为它的编码方式非常简单,使用%加上两位的字符(012345678ABCDEF)代表一个字节的十六进制形式。URL 编码默认使用的字符集是US-ASCII。例如a在US-ASCII码中对应的字节是0x61,那么URL编码后得到的就是%61。

    如保留字符的URL编码

! * " ' ( ) ; : @ & = + $ , / ? % # [ ]
%21 %2A %22 %27 %28 %29 %3B %3A %40 %26 %3D %2B %24 %2C %2F %3F %25 %23 %5B %5D

    这也是最常见的POST|提交方式,浏览器的原生<form>表单,如果不设置enctype属性,那么最终会以application/x-www-form-urlencoded 方式提交数据。

    URL编码详情见本文附录。

 

  例如 JQuery 和 QWrap 的 Ajax,Content-Type 默认值都是「application/x-www-form-urlencoded;charset=utf-8」

  使用这种方式,抓包看到的请求是这样的:

POST http://xxx/query.json HTTP/1.1
Host: xxx
Connection: keep-alive
Content-Length: 294
Accept: */*
Origin: xxx
X-Requested-With: XMLHttpRequest
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.81 Safari/537.36
Content-Type: application/x-www-form-urlencoded; charset=UTF-8
Referer: xxx
Accept-Encoding: gzip, deflate
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8
Cookie: JSESSIONID=aaa1xsjvLKCZC-beX0-1w

sEcho=1&iColumns=7&sColumns=&iDisplayStart=0&iDisplayLength=10&mDataProp_0=id&mDataProp_1=schemeId&mDataProp_2=redeemNo&mDataProp_3=redeemCode&mDataProp_4=function&mDataProp_5=function&mDataProp_6=function&schemeId=160425SCH1461578754536&num=&comment=&source=&expiretime=&attachmentName=&state=

  请求参数是key/value的形式,并以&符拼接在一起,但是不会在请求URL中显示。

 

  补充:基于请求方式为Content-Type:application/x-www-form-urlencoded;charset=utf-8 的接口签名机制

  1)构造待签名串

    ① 将除“sign”外的所有参数按key进行字典升序排列,将排序后的参数(key=value)用&拼接起来。 

    ② 将上面生成的字符串进行URL编码(如果是用HttpClient工具类发送请求(会将参数进行URL编码),待签名串可不必URL编码)

  2)生成sign值

    ① 使用HMAC-SHA1加密算法,使用 accessKey 对1)中得到的待签名串加密    

    ② 然后将加密后的字符串进行Base64编码

    ③ 由于生成的签名中可能包含“=”,因此需要对sign再进行一次URL编码

 

 

  2、multipart/form-data

  我们使用表单上传文件时,必须设置 <form> 表单的enctype属性 等于 multipart/form-data。

  使用这种方式,抓包看到的请求是这样的:

POST http://xxx HTTP/1.1
Host: xxx
Connection: keep-alive
Content-Length: 356
Accept: application/json, text/javascript, */*; q=0.01
Origin: xxx
X-Requested-With: XMLHttpRequest
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.81 Safari/537.36
Content-Type: multipart/form-data; boundary=----WebKitFormBoundary5SBLMDU5DZ2Hmqej
Referer: xxx
Accept-Encoding: gzip, deflate
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8
Cookie: JSESSIONID=aaa1xsjvLKCZC-beX0-1w

------WebKitFormBoundary5SBLMDU5DZ2Hmqej
Content-Disposition: form-data; name="file"; filename="xxx.sql"
Content-Type: application/octet-stream

use xxx;
insert into xxx;
------WebKitFormBoundary5SBLMDU5DZ2Hmqej--

 

  3、application/json  (推荐使用)

  用来告知服务器消息主体(body)是序列化后的JSON字符串。使用此种方式需要解析request中的body获取请求数据。

  使用Spring的话用@RequestBody注解来解析请求参数,这个注解说明参数是从HTTP的body中去获取。

  使用这种方式,抓包看到的请求是这样的:

POST http://xxx HTTP/1.1
Host: xxx
Connection: keep-alive
Content-Length: 160
Accept: application/json, text/javascript, */*; q=0.01
Origin: xxx
X-Requested-With: XMLHttpRequest
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.81 Safari/537.36
Content-Type: application/json
Referer: xxx
Accept-Encoding: gzip, deflate
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8
Cookie: JSESSIONID=aaa1xsjvLKCZC-beX0-1w

{"schemeId":"160425SCH1461578754536","attachmentName":"xxx.sql","num":"30","comment":"test","expiretime":"2019-09-01"}

 

  4、text/xml 

  XML-RPC(XML Remote Procedure Call,它是一种使用 HTTP 作为传输协议,XML 作为编码方式的远程调用规范

  不过这种方式暂时没有用过。

 

 

 

附录:

  URL编码与解码

  对于URL来说,编码是为了消除歧义。如POST使用Content-Type:application/x-www-form-urlencoded 方式提交数据时,URL参数字符串之间使用【key=value&key=value】的形式来传输,键值之间以&符拼接和分割,那么如果参数名key或者参数值value中包含了=或者&符号势必会造成接收URL的服务器解析错误,因此必须对引起歧义的符号进行转义,也就是编码。

  URL的编码格式采用ASCII码,也就是说,不能在URL中包含任何非ASCII字符,例如中文。

  RFC3986文档规定,URL中只允许包含英文字母(a-zA-Z)、数字、-_.~ 4个特殊字符以及所有保留字符。URL编码中的10-7F字节全部都表示控制字符,这些字符都不能放在URL中。

  RFC3986中指定了以下字符为保留字符:! * ' ( ) ; : @ & = + $ , / ? # [ ]

  不安全字符:还有一些字符,当他们直接放在Url中的时候,可能会引起解析程序的歧义。这些字符被视为不安全字符,原因有很多。

    空格:Url在传输的过程,或者用户在排版的过程,或者文本处理程序在处理Url的过程,都有可能引入无关紧要的空格,或者将那些有意义的空格给去掉。
    引号以及<>:引号和尖括号通常用于在普通文本中起到分隔Url的作用
    #:通常用于表示书签或者锚点
    %:百分号本身用作对不安全字符进行编码时使用的特殊字符,因此本身需要编码
    {}|\^[]`~:某一些网关或者传输代理会篡改这些字符

  需要注意的是,对于Url中的合法字符,编码和不编码是等价的。

如何对Url中的非法字符进行编码

  URL编码也叫percent-encoding(百分号编码),之所以叫百分号编码,是因为它的编码方式非常简单,使用%加上两位的字符(012345678ABCDEF)代表一个字节的十六进制形式。URL 编码默认使用的字符集是US-ASCII。例如a在US-ASCII码中对应的字节是0x61,那么URL编码后得到的就是%61。我们在地址栏上输入http://g.cn/search?q=%61%62%63,实际上就等同于在google上搜索abc了。又如@符号在ASCII字符集中对应的字节为0x40,经过Url编码之后得到的是%40。

  对于非ASCII字符,需要使用ASCII字符集的超集进行编码得到相应的字节,然后对每个字节执行百分号编码。对于Unicode字符,RFC文档建议使用utf-8对其进行编码得到相应的字节,然后对每个字节执行百分号编码。如"中文"使用UTF-8字符集得到的字节为0xE4 0xB8 0xAD 0xE6 0x96 0x87,经过Url编码之后得到"%E4%B8%AD%E6%96%87"。

posted @ 2019-10-18 16:33  杨岂  阅读(3050)  评论(0编辑  收藏  举报