04 2023 档案

摘要:深度学习计算 1. 块提供的基本功能: 1. 输入数据作为前向传播函数的参数 2. 通过前向传播函数生成输出 3. 计算其输出关于输入的梯度 4.存储和访问前向传播计算所需的参数 5. 根据需要初始化模型参数 2. Sequential 类 1. 将块逐个追加到列表中的函数 2. 前向传播函数,用于 阅读全文
posted @ 2023-04-23 20:58 dunimaa 阅读(89) 评论(0) 推荐(0) 编辑
摘要:引言 一:过去⼗年中取 得巨⼤进步的想法 1.如dropout (Srivastava et al., 2014),有助于减轻过拟合的危险。这是通过在整个神 经⽹络中应⽤噪声注⼊ (Bishop, 1995) 来实现的,出于训练⽬的,⽤随机变量来代替权重 2.注意⼒机制解决了困扰统计学⼀个多世纪的问 阅读全文
posted @ 2023-04-05 09:47 dunimaa 阅读(235) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示