2024年4月16日
摘要: 通过 pytorch 训练模型的逻辑: import torch.nn as nn import torch import numpy #from torch.utils.tensorboard import SummaryWriter import time vocabList = ["0","1 阅读全文
posted @ 2024-04-16 18:17 细雨微光 阅读(11) 评论(0) 推荐(0) 编辑
摘要: sft之lora: 阅读全文
posted @ 2024-04-16 10:34 细雨微光 阅读(8) 评论(0) 推荐(0) 编辑
摘要: transformers load模型运行机制 阅读全文
posted @ 2024-04-16 10:07 细雨微光 阅读(12) 评论(0) 推荐(0) 编辑
摘要: bert 源码分析: class BertSelfAttention 阅读全文
posted @ 2024-04-16 10:06 细雨微光 阅读(6) 评论(0) 推荐(0) 编辑