Kaldi nnet3的导数单元测试理论依据

对参数进行扰动

Kaldi nnet3的以下单元测试代码中

nnet3/attention-test.cc

kaldi::nnet3::attention::TestAttentionForwardBackward

nnet3/convolution-test.cc

kaldi::nnet3::time_height_convolution::TestDataBackprop

kaldi::nnet3::time_height_convolution::TestParamsBackprop

nnet3/nnet-derivative-test.cc

kaldi::nnet3::UnitTestNnetModelDerivatives

BaseFloat objf_baseline = TraceMatMat(output_deriv, output, kTrans);

in2.SetRandn();

BaseFloat predicted_delta_objf = TraceMatMat(in_deriv, in2, kTrans);

in2.AddMat(1.0, in);

Forward(in2, &output);

BaseFloat objf2 = TraceMatMat(output_deriv, output, kTrans),

observed_delta_objf = objf2 - objf_baseline;

KALDI_ASSERT(observed_delta_objf.ApproxEqual(predicted_delta_objf, 0.1));

有以下假设:

若有:

则反向传播代码是正确的。

以下证明线性变换满足此假设:

假设

   

根据微分与导数的关系:

因此,只要上述公式成立,则说明反向传播函数相对正向传播函数是正确的。

   

对模型进行扰动

Kaldi nnet3的以下单元测试代码中

nnet3/nnet-derivative-test.cc:UnitTestNnetModelDerivatives()

有以下假设:

若有:

𝚯是模型参数

将模型参数视为函数参数

则模型的前向传播和反向传播代码是正确的。

以下证明线性变换满足此假设:

假设

   

   

   

posted @ 2020-03-31 17:57  JarvanWang  阅读(272)  评论(0编辑  收藏  举报