Http系列:断点续传与多线程下载
前言
当下载电影时,我常常会想中断下载后,为什么点击开始时会在中断的地方继续下载呢?
又或者在看在线电影时,为什么可以按着播放条拖动就能看到想看的片段呢?
http的range请求将解决以上困惑。
多线程、断点续传、随机点播等的场景的步骤
1、客户端明确任务:从哪开始下载
- 本地是否已有部分文件:文件已下载部分在服务器端发生改变?
- 使用几个线程并发下载
2、下载文件的指定部分内容
3、下载完毕后拼装成统一的文件
HTTP Range规范
在RFC7233中有详细介绍
1、允许服务器基于客户端的请求只发送响应包体的一部分给到客户端,而客户端自动将多个片段的包体组合成完整的体积更大的包体。
- 支持断点续传
- 支持多线程下载
- 支持视频播放器实时拖动
2、服务器通过Accept-Range头部表示是否支持Range请求
- Accept-Ranges = acceptable-ranges
- 例如:
Accept-Ranges: bytes: 支持;
Accept-Ranges: none: 不支持
Range请求范围的单位
基于字节为单位的时候,举例:设置响应体长度为10000
- 第1个500字节:
bytes=0-499 // 从0开始 - 第2个500字节:
bytes=500-999
bytes=500-600, 601-999
bytes=500-700, 601-999 - 最后1个500字节
bytes=-500
bytes=9500- - 仅要第一个和最后一个字节:bytes=0-0, -1
通过Range头部传递请求范围,如:Range: bytes=0-499
测试
下面用一些小例子有测试一下。
用node搭了一个简单的服务器,返回的数字是22个字节的响应体
'Hello World 0123456789';
现在用curl命令获取全部的响应体,然后访问0-5的字节段:
-H参数添加 HTTP 请求的标头。
上面的命令就是添加HTTP头Range: bytes=0-5。
返回的是Hello (加上空格)一共六个字节。
现在获取第21个字节及以后的字节段,就可以用20-:
Range条件请求
- 如果客户端已经得到了Range响应的一部分,并想在这部分响应未过期的情况下,获取其他部分的响应
常与If-Unmodified-Since或者If-Match头部共同使用 - If-Range = entity-tag / HTTP-date
可以使用Etag或者Last-Modified
测试
下面用etag测试一下Range条件请求
然后用-I来看看生成Hello 时服务器生成Etag的值
接下来,用这个值放到If-Match中获取6-10字节段:World
如果Etag发生了变化,来看看结果会怎么样,将最后的0改为1
结论
通过条件请求可以判断两次下载之间,服务器端资源有没有发生变化。如果发生了变化,就可以通过412这个响应知道,资源已经发生了变化。
服务器响应
如果只获取部分的body,那么服务器端返回的响应码不是200,而是206。
206 Partial Content
-
Content-Range头部:显示当前片段响应体在完整包体中的位置
-
Content-Range = byte-content-range / other-content-range
{ btye-content-range = bytes-unit SP (byte-range-resp / unsatisfied-range)
byte-range-resp = byte-range '/' (complete-length / '')
complete-length = 1DIGIT // 完整资源的大小,如果未知则用*号替代
bytr-range = first-byte-pos "-" last-byte-pos } -
例如:
1、Content-Range: bytes 42-1233/1234
2、Content-Range: bytes 42-1233/*
测试
416 Range Not Statisfiable
- 请求范围不满足实际资源的大小,其中Content-Range中的complete-length显示完整响应的长度,例如
Content-Range: bytes */1234
测试
如果获取范围超出实际资源的大小,比如获取30-40。返回416
200 OK
- 服务器不支持Range请求时,则以200返回完整的响应包体
多重范围与multipart
- 请求:
Range: bytes=0-50, 100-150 - 响应:
Content-Type: multipart/byteranges; boundary=...
测试
获取5-10, 10-15片段。
总结
1、客户端通过Range头部传递请求范围
2、服务端返回Accept-Range头部表示是否支持Range请求。
3、客户端如果在得到Range响应的一部分,并想在这部分响应未过期的情况下,获取其他部分的响应,可以用If-Range头部使用Etag或者Last-Modified为值。
4、只获取部分的body,服务器返回206响应码,其中Content-Range头部显示当前片段响应体在完整包体中的位置
5、客户端想多重范围下载资源,在Range头部的格式为Range: bytes=0-50, 100-150...(用逗号分隔)
响应头部Content-Type: multipart/byteranges; boundary=...
作者: zhangwinwin
链接:Http系列:断点续传与多线程下载
来源:github