Golang计算文件MD5
前面这篇文章<Golang里面MD5的写法和性能>介绍了如何计算字符串的md5,下面我们来说说如何计算文件的md5。
https://wangbjun.site/2020/coding/golang/file-md5.html
1.错误的方式
有人说,文件可以读取成字符串,然后再计算就可以了,如下:
func FileMD5(filePath string) (string, error) {
|
此方法确实没问题,但是需要考虑一个问题,假如文件比较大呢?比如有好几个GB,如果按这个做法也得占用好几个GB内存,肯定存在问题。
经过我测试,在实际运行中,这种方式占用的内存是文件大小的好几倍,1个GB的文件需要大概4个GB的内存,太恐怖了。
2.正确的方式
func FileMD5(filePath string) (string, error) {
|
经过实际测试发现占用内存几乎非常非常少,这里大家就会发现md5.New()的用途所在了,简单分析一下为什么这种方式占用内存少。
首先要了解io.Copy方法的含义,可以先看看注释:
// Copy copies from src to dst until either EOF is reached
|
可以看出来,它底层调用了一个copyBuffer,这个方法底层在copy的时候会临时分配一个buffer缓存区,默认大小32k,每次只会占用32k大小内存,如果想自定义缓存区大小可以使用CopyBuffer:
// CopyBuffer is identical to Copy except that it stages through the
|
最后配合Sum方法,每次计算32k,不断循环计算,直到算完,所以几乎不占用内存。
3.总结
如果计算的文件都是小文件,内存比较大的话,追求速度的话可以使用第一种方法,如果你计算的文件非常大,务必使用第二种方法,不然内存会爆掉。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 清华大学推出第四讲使用 DeepSeek + DeepResearch 让科研像聊天一样简单!
· 推荐几款开源且免费的 .NET MAUI 组件库
· 实操Deepseek接入个人知识库
· 易语言 —— 开山篇
· Trae初体验
2020-06-15 oh-my-zsh配置
2018-06-15 为什么有的人喜欢看烧脑剧?
2018-06-15 Google TensorFlow 机器学习框架介绍和使用
2018-06-15 几种机器学习框架的对比和选择
2017-06-15 Linux(deepin)安装Oracle JDK
2017-06-15 Spring框架学习