使用Go处理HTTP压缩文件数据总结

前言

最近遇到了一个HTTP请求返回一个gz压缩包的问题,前前后后搞了3天,总算是把整个流程以及处理的细节搞明白了,总结一篇博客记录分享一下。

问题描述几解决方案

流量方的优化

获取某推广告成效数据的时候由于数据量很多,可能会导致Response数据量过大从而造成请求失败的问题。

某推服务方设计了这样一种方式:先将请求的到的数据写入到一个json文件中,然后将这个json文件使用gzip压缩(经过实际测试,一个100多k大小的json文件使用gzip压缩后只有十几k的大小,并且gzip压缩后是不保留原文件的)。

最终服务端存的是一个压缩后的gz文件,然后返回给用户端一个链接,用户根据这个链接去“下载”压缩后的数据文件,大大减少了网络带宽的占用!

比如我们可以通过下面这个链接下载成效数据:成效数据链接 

也就是说,与我们平时处理的请求不同的是,现在这种情况下发送GET请求得到的是一个gz文件的数据流。

解决思路

其实解决问题的思路有2个:一个是根据gz数据流将gz文件写入到本地,然后在本地解压这个文件,读取解压后的文件;另外一种思路是直接根据gz数据流将json文件解压到本地,省去了中间在本地生成gz压缩文件的过程!

一目了然:在上面描述的业务场景中,肯定是第二种解决方案最优!

优化的三方包

从网上找了一个包去处理文件解压缩的问题,但是其源码本身有一些问题,略微修改了一下其源码后便可使用了。

最终修改后的项目地址请访问:Unpackit

原文件存在的问题可以看README的描述。

解决问题的demo

自己写了一个demo专门用来展示两种解决方案的实现过程。

麻雀虽小,五脏俱全,这个demo用到了自定制错误、http的连接池,以及go中常用的错误返回机制。

项目地址如下,欢迎star:https://gitee.com/huoyingwhw/unpackit-demo

细节记录

关于一些解决问题中间的细节请查看笔者另外2篇博客:

使用Golang解压缩文件遇到的问题及解决方法

使用unpackit包解压gz包遇到的一个问题与解决方案 

 

posted on 2021-01-30 17:58  江湖乄夜雨  阅读(906)  评论(0编辑  收藏  举报