摘要:
一、不含参数层 通过继承Block自定义了一个将输入减掉均值的层:CenteredLayer类,并将层的计算放在forward函数里, 二、含参数层 注意,本节实现的自定义层不能自动推断输入尺寸,需要手动指定 见上节『MXNet』第三弹_Gluon模型参数在自定义层的时候我们常使用Block自带的P 阅读全文
摘要:
MXNet中含有init包,它包含了多种模型初始化方法。 一、访问模型参数 我们知道可以通过[]来访问Sequential类构造出来的网络的特定层。对于带有模型参数的层,我们可以通过Block类的params属性来得到它包含的所有参数。例如我们查看隐藏层的参数: print(net[0].param 阅读全文
摘要:
上节用了Sequential类来构造模型。这里我们另外一种基于Block类的模型构造方法,它让构造模型更加灵活,也将让你能更好的理解Sequential的运行机制。 回顾: 序列模型生成 层填充 初始化模型参数 两点讲解: super(MLP, self).__init__(**kwargs):调用 阅读全文