摘要: 在机器学习中,线性回归、逻辑回归问题总是绕不开代价函数。本文将从代价函数的个人理解,均方误差代数函数作用原理以及在线性回归问题中为什么选择均方误差代数函数阐述。 1、代价函数的理解: 代价函数:真实的值与预测的值之间的偏差,由于偏差有可能正有可能负,因此使用均方差来表示。代价函数的目的即用于找到最优 阅读全文
posted @ 2021-02-05 21:39 常给自己加个油 阅读(399) 评论(0) 推荐(0) 编辑
摘要: 博文目录 1. 概述 2. 梯度下降算法 2.1 场景假设 2.2 梯度下降 2.2.1 微分 2.2.2 梯度 2.3 数学解释 2.3.1 α 2.3.2 梯度要乘以一个负号 3. 实例 3.1 单变量函数的梯度下降 3.2 多变量函数的梯度下降 4. 代码实现 4. 1 场景分析 4. 2 代 阅读全文
posted @ 2021-02-05 17:59 常给自己加个油 阅读(200) 评论(0) 推荐(0) 编辑
摘要: 参考:1.莫烦什么是DQN 2强化学习:DQN与Double DQN讨论 3实战深度强化学习DQN-理论和实践 DQN(深度神经网络)是Q learning 与神经网络结合的产物。 1.传统的Q learning 先回顾一下传统的Q learning 算法。 Q learning 是异策略时间差分算 阅读全文
posted @ 2021-02-05 15:24 常给自己加个油 阅读(107) 评论(0) 推荐(0) 编辑