如何知道一个大模型在推理和训练时需要多少显存?
视频地址:
https://www.youtube.com/watch?v=Z9eV9mbB6uY
相关地址:
https://huggingface.co/spaces/hf-accelerate/model-memory-usage
详细内容:
https://techdiylife.github.io/blog/topic.html?category2=t05&blogid=0031
2 开发环境
Transformers 4.38.1
Accelerate 0.27.2
3 使用方法
这个工具 accelerate estimate-memory 是 huggingface 的 accelerate 开发库中提供的一个工具。使用这个工具,并不会真正的下载或者加载模型到内存中,它只是根据meta数据来对大模型所需要的内存进行模拟计算。所以,运行此工具并不需要您有GPU机器。
本博客是博主个人学习时的一些记录,不保证是为原创,个别文章加入了转载的源地址,还有个别文章是汇总网上多份资料所成,在这之中也必有疏漏未加标注处,如有侵权请与博主联系。
如果未特殊标注则为原创,遵循 CC 4.0 BY-SA 版权协议。
标签:
杂谈
posted on 2024-12-14 17:51 Angry_Panda 阅读(67) 评论(0) 编辑 收藏 举报
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· 什么是nginx的强缓存和协商缓存
· 一文读懂知识蒸馏
· Manus爆火,是硬核还是营销?
2023-12-14 纪念:买了人生中第一个域名 —— 华为云平台上购买的第一个网络域名
2022-12-14 python多进程multiprocessing模块的变量传递问题:父进程中的numpy.array对象隐式序列化到子进程后的inplace操作的问题
2022-12-14 cloudpickle —— Python分布式序列化的专用模块
2019-12-14 【转载】 tf.Print() (------------ tensorflow中的print函数)
2018-12-14 PyTorch 数据集类 和 数据加载类 的一些尝试