02 2021 档案

摘要:数学模型:马尔可夫决策过程$(MDP)$ 强化学习方法形式化为$MDP$,$MDP$是序列决策算法的一般数学框架 通常将$MDP$表示为四元组$(S,A,P,R)$: $S$表示状态空间,是描述环境的状态,表示为$S={s_1,s_2,s_3,...}$ $A$表示行动空间,是智能体可执行的行动,表 阅读全文
posted @ 2021-02-04 12:58 DemonSlayer 阅读(169) 评论(0) 推荐(0)
摘要:应用领域全面突破:图像识别 图像识别近年来取得重大突破,主要突破点在深度学习和卷积神经网络,成绩的大幅度提升几乎都伴随着卷积神经网络的层数加深。 $Google$神经机器翻译系统在多种语言间的翻译性能取得大幅提升,接近人类的翻译水平 在语音识别领域极具挑战性的$SwitchBord$任务中 $GMM 阅读全文
posted @ 2021-02-03 22:13 DemonSlayer 阅读(192) 评论(0) 推荐(0)
摘要:维度灾难$(curse,of,dimensionality)$ 随着维度(例如特征或自由度)的增多,问题的复杂性(或计算代价)呈指数级增长的现象 1961年美国数学家$Richard,Bellman$在研究动态规划时首次提出 很多问题困难的根本来源,例如经典或量子多体问题,基于第一性原理的药物和材料 阅读全文
posted @ 2021-02-02 22:08 DemonSlayer 阅读(214) 评论(0) 推荐(0)
摘要:$batch$和$mini-batch$梯度下降 $batch$梯度下降:使用全部训练集样本,计算代价太高$(n\sim10^6)$ $mini-batch$梯度下降:随机采样一个子集$(m\sim102或103)$ \[ \nabla J(\theta)=\frac{1}{m}\sum^m_{j= 阅读全文
posted @ 2021-02-01 23:13 DemonSlayer 阅读(191) 评论(0) 推荐(0)