03 2022 档案

摘要:近日学习LSTM结构,已有很多博客对LSTM结构进行说明,但某些细节仍然存在模糊情况,为此本文将进行补充与说明,可分以下内容: 一.RNN原理简介与LSTM原理阐释。 一般来说,RNN的输入和输出都是一个序列,分别记为和 ,同时的取值不仅与有关还与序列中更早的输入有关(序列中的第t个元素我们叫做序列 阅读全文
posted @ 2022-03-30 23:00 tangjunjun 阅读(1670) 评论(0) 推荐(0) 编辑
摘要:Tkinter 编译互动的具有窗口的python代码 Python 提供了多个图形开发界面的库,几个常用 Python GUI 库如下: Tkinter: Tkinter 模块(Tk 接口)是 Python 的标准 Tk GUI 工具包的接口 .Tk 和 Tkinter 可以在大多数的 Unix 平 阅读全文
posted @ 2022-03-20 01:01 tangjunjun 阅读(353) 评论(0) 推荐(0) 编辑
摘要:本文简单介绍知识蒸馏教师模型与学生模型使用loss方法: 一 .loss求解方法 hard label:训练的学生模型结果与真实标签进行交叉熵loss,类似正常网络训练。 soft label:训练的学生网络与已经训练好的教师网络进行KL相对熵求解,可添加系数,如温度,使其更soft。 知乎回答:l 阅读全文
posted @ 2022-03-20 00:51 tangjunjun 阅读(4369) 评论(0) 推荐(1) 编辑
摘要:本文主要解决模型权重迁移,主要使用pytorch读取某个权重,将其赋值给新权重格式,以下为原始代码: 顺带参数计算函数代码: 参数计算: def count_parameters(model): return sum(p.numel() for p in model.parameters() if 阅读全文
posted @ 2022-03-15 16:33 tangjunjun 阅读(975) 评论(0) 推荐(0) 编辑
摘要:本文简单介绍模型训练时候,使用准确率求解过程,不涉及精确率和召回率计算, 本文给出简要计算方法与代码。 计算方法: 使用top1计算为例(以下以2个batch,3个num_classes举列): 网络预测结果形式:pred=[b,num_classes] ,如pred=[[0.6,0.8,0.9], 阅读全文
posted @ 2022-03-06 08:51 tangjunjun 阅读(5647) 评论(0) 推荐(0) 编辑

https://rpc.cnblogs.com/metaweblog/tangjunjun
点击右上角即可分享
微信分享提示