12 2024 档案
使用Llama-3.2-1B遇到的bug
摘要:背景 在使用Llama-3.2-1B时遇到一个关于pad_tokens经验不足的bug。没有指定pad_token的时候分词器会报错,这个使用有以下两种解决策略: 配一个新的token。 tokenizer.add_special_tokens({'pad_token': '[PAD]'}) mod
阅读全文
使用从HuggingFace上下载Llama模型
摘要:背景 这里记录一下从HuggingFace上下载Llama模型的流程,方便后续使用。 注册账号 目前Llama的模型是需要提交申请才可以使用,因此需要先注册HuggingFace的账号。这里有两点需要注意。 用户名会用来登录:用户名会用作后续下载模型使用,因此需要使用一个自己方便记忆的名称。 用户名
阅读全文
latex包中参数的意义及使用
摘要:工具包 hyperref hyperref 包提供了多个颜色选项来定制文档中超链接的颜色: colorlinks=true:启用彩色链接(而不是边框)。 linkcolor:内部链接的颜色(例如,章节、节标题等之间的链接)。 anchorcolor:锚点的颜色(定义了但未被点击的链接)。 filec
阅读全文
模型训练过程中的记录工具
摘要:背景 在模型训练过程中,需要记录很多数据,例如损失值,评价指标,使用的参数等,这里介绍一下可以使用的工具,方便后续使用。 工具 Pandas + openpyxl:pandas 是一个强大的数据处理库,而 openpyxl 是一个用于读写 Excel 文件的库。你可以使用 pandas 来创建和操作
阅读全文