2023年9月26日

摘要: miniconda:这种方式安装的python不会有错误,最稳妥. https://mirrors.bfsu.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh conda create -n Test1 python=3.9 co 阅读全文
posted @ 2023-09-26 17:09 张博的博客 阅读(11) 评论(0) 推荐(0) 编辑
摘要: 大模型如何轻量化训练和部署是非常重要的问题. 相关论文也需要学习. 第一篇我就写这里. 8-BIT OPTIMIZERS VIA BLOCK-WISE QUANTIZATION 1. 基本知识: 1.1状态优化器 一个优化器在迭代第t次时候更新神经网络参数w的公式为: . L是损失函数. 分别是sg 阅读全文
posted @ 2023-09-26 14:04 张博的博客 阅读(124) 评论(0) 推荐(0) 编辑

导航