摘要: 0、引言 本文记录使用pytorch、huggingface/transformer 框架工作流程,内容包括: 数据读取 数据预处理(split shuffle) 预训练模型下载和准备(预训练模型参数下载,模型对应Token及超参初始化) 模型训练、验证、结果测试 模型本地持久化 训练过程数据可视化 阅读全文
posted @ 2021-09-14 17:23 Joshua王子 阅读(794) 评论(0) 推荐(0) 编辑