摘要: 在 Pytorch 中一种模型保存和加载的方式如下: 其实返回的是一个 ,存储了网络结构的名字和对应的参数,下面看看源代码如何实现的。 state_dict 可以看到state_dict函数中遍历了4中元素,分别是 ,`_buffers _modules _state_dict_hooks stat 阅读全文
posted @ 2019-12-20 22:31 marsggbo 阅读(32982) 评论(2) 推荐(2) 编辑
摘要: 下文都将 简写成 Module: 就是我们常用的 类,你定义的所有网络结构都必须继承这个类。 Buffer: buffer和parameter相对,就是指那些不需要参与反向传播的参数 示例如下: Parameter: 是 ,也就是组成Module的参数。例如一个 通常由 和`bias require 阅读全文
posted @ 2019-12-20 21:59 marsggbo 阅读(5946) 评论(0) 推荐(3) 编辑
摘要: 参考: "https://petewarden.com/2015/04/20/why gemm is at the heart of deep learning/" 平常都是无脑使用Pytorch提供的 方法,但是并不关心具体该如何实现,原来是把卷积操作转化成矩阵乘法,而不是真的通过滑动卷积核来做卷 阅读全文
posted @ 2019-12-20 17:32 marsggbo 阅读(4515) 评论(0) 推荐(0) 编辑