【转】HTTP协议之multipart/form-data请求分析
原文链接:http://blog.csdn.net/five3/article/details/7181521
首先来了解什么是multipart/form-data请求:
根据http/1.1 rfc 2616的协议规定,我们的请求方式只有OPTIONS、GET、HEAD、POST、PUT、DELETE、TRACE等,那为为何我们还会有multipart/form-data请求之说呢?这就要从头来说了。
http协议大家都知道是规定了以ASCII码传输,建立在tcp、ip协议之上的应用层规范,规范内容把http请求分为3个部门:状态行,请求头,请求体。所有的方法、实现都是围绕如何运用和组织这三部分来完成的。换句话来说就是万变不离其中,只要我们了解了http请求的组成部分后,自然就可以应变任何实际工作中的需求和问题了。
关于状态行,请求头,请求体等三部分的具体内容,大家可以参考官方的协议文档http://www.faqs.org/rfcs/rfc2616.html,这里主要分析multipart/form-data请求具体是怎么一回事。
既然http协议本身的原始方法不支持multipart/form-data请求,那这个请求自然就是由这些原始的方法演变而来的,具体如何演变且看下文:
1、multipart/form-data的基础方法是post,也就是说是由post方法来组合实现的
2、multipart/form-data与post方法的不同之处:请求头,请求体。
3、multipart/form-data的请求头必须包含一个特殊的头信息:Content-Type,且其值也必须规定为multipart/form-data,同时还需要规定一个内容分割符用于分割请求体中的多个post的内容,如文件内容和文本内容自然需要分割开来,不然接收方就无法正常解析和还原这个文件了。具体的头信息如下:
//其中${bound} 是一个占位符,代表我们规定的分割符,可以自己任意规定,但为了避免和正常文本重复了,尽量要使用复杂一点的内容。如:--------------------56423498738365
4、multipart/form-data的请求体也是一个字符串,不过和post的请求体不同的是它的构造方式,post是简单的name=value值连接,而multipart/form-data则是添加了分隔符等内容的构造体。具体格式如下:
其中${bound}为之前头信息中的分割符,如果头信息中规定为123,那么这里也要为123,;可以很容易看出,这个请求体是多个相同的部分组成的:每一个部分都是以--加分隔符开始的,然后是该部分内容的描述信息,然后一个回车,然后是描述信息的具体内容;如果传送的内容是一个文件的话,那么还会包含文件名信息,以及文件内容的类型。上面的第二个小部分其实是一个文件体的结构,最后会以--分割符--结尾,表示请求体结束。
综上,可以知道要发送一个multipart/form-data的请求,其实任何支持post请求的工具或语言都可以支持,只是自己要稍微包装一下便可。
参考资料:
百度百科: http://baike.baidu.com/view/9472.htm
http1.1协议规范: http://www.faqs.org/rfcs/rfc2616.html
分析工具:httpAnalyzer
当然,附上C#源码,应该很轻松就可以转Java
using System; using System.Collections.Generic; using System.IO; using System.Linq; using System.Text; using System.Threading.Tasks; namespace Msf.Engine.Network.NetworkTool { public sealed class MultipartFormData : IDisposable { public const string Boundary = "--the_great_maoshu--"; public static string ContentType { get { return "multipart/form-data; boundary=" + Boundary; } } private MemoryStream _stream; public MemoryStream Stream { get { return _stream ?? (_stream = new MemoryStream()); } } public MultipartFormData() { } public void AddContent(string name, string value) { var sp = string.Format("--{0}\r\n", Boundary); sp += string.Format( "Content-Disposition: form-data; name=\"{0}\"; \r\n\r\n{1}", name, value); var data = Encoding.UTF8.GetBytes(sp); Stream.Write(data, 0, data.Length); } public void AddContent(string name, string fileName, byte[] fileData) { var sp = string.Format("--{0}\r\n", Boundary); sp += string.Format( "Content-Disposition: form-data; name=\"{0}\"; filename=\"{1}\"\r\nContent-Type: application/octet-stream\r\n\r\n", name, fileName); var data = Encoding.UTF8.GetBytes(sp); Stream.Write(data, 0, data.Length); Stream.Write(fileData, 0, fileData.Length); data = Encoding.UTF8.GetBytes("\r\n"); Stream.Write(data, 0, data.Length); } public byte[] GetPostData() { var sp = string.Format("--{0}--\r\n", Boundary); var data = Encoding.UTF8.GetBytes(sp); Stream.Write(data, 0, data.Length); Stream.Position = 0; return Stream.ToArray(); } public void Dispose() { if (_stream != null) _stream.Dispose(); _stream = null; } } }
作者:newcj
出处:http://newcj.cnblogs.com/
欢迎转载,但还请尊重劳动果实,保留此段声明并注明原文链接。