04 2023 档案
摘要:深度学习计算 1. 块提供的基本功能: 1. 输入数据作为前向传播函数的参数 2. 通过前向传播函数生成输出 3. 计算其输出关于输入的梯度 4.存储和访问前向传播计算所需的参数 5. 根据需要初始化模型参数 2. Sequential 类 1. 将块逐个追加到列表中的函数 2. 前向传播函数,用于
阅读全文
摘要:引言 一:过去⼗年中取 得巨⼤进步的想法 1.如dropout (Srivastava et al., 2014),有助于减轻过拟合的危险。这是通过在整个神 经⽹络中应⽤噪声注⼊ (Bishop, 1995) 来实现的,出于训练⽬的,⽤随机变量来代替权重 2.注意⼒机制解决了困扰统计学⼀个多世纪的问
阅读全文