yijun0730 - 博客园

三、支持向量机

摘要： 1. 间隔与支持向量数据集$D = \{ ({{\bf{x}}_1},{y_1}),({{\bf{x}}_2},{y_2}),...,({{\bf{x}}_m},{y_m})\} $，其中${{\bf{x}}_i} = \{ {x_{i1}},{x_{i2}},...,{x_{id}}\} $，包阅读全文

posted @ 2018-11-18 17:22 yijun0730 阅读(319) 评论(0) 推荐(0) 编辑

二、决策树

摘要： 1. 构建一颗树一棵树包含一个根节点、若干个内部结点和若干个叶节点。从根节点开始，经由若干个内部结点，到不同的分支，最终到达不同的叶节点。根节点包含了样本全集，叶节点对应了决策结果，从根节点到每个叶节点的路径对应了一个判定测试样本。对于一棵用于分类的决策树来说，关键就是若干个内部结点的确定。阅读全文

posted @ 2018-11-11 21:08 yijun0730 阅读(207) 评论(0) 推荐(0) 编辑

一、线性模型

摘要： 1.线性回归对包含$d$个属性描述的数据${\bf{x}} = \{ {x_1},{x_2},...,{x_d}\}$，建立一个加权线性模型，$f({\bf{x}}) = {\omega _1}{x_1} + {\omega _2}{x_2} + ... + {\omega _d}{x_d} + 阅读全文

posted @ 2018-11-08 22:17 yijun0730 阅读(320) 评论(0) 推荐(0) 编辑

3. 免模型策略估计——蒙特卡洛（Monte-Carlo）和时序差分（Temporal-Difference）

摘要：上一篇动态规划讲的是在马尔科夫模型$<S, A, P, R, \gamma>$完全已知的情况下，利用概率全展开求解最优策略。可是有很多实际的情况是，我们没办法获得准确的分布来全概率展开的，那么对于这样马尔科夫模型不完全已知，即转移概率未知，不能全概率展开的情况我们应该怎么做呢？这就是强化学习的核心了阅读全文

posted @ 2018-11-01 11:48 yijun0730 阅读(901) 评论(0) 推荐(0) 编辑

2. 动态规划

摘要：在马尔科夫模型（MDP）完全已知的情况下，我们可以用动态规划来求解最优策略，求出在给定状态$s$下，应该选择哪一个下个状态$s'$，这样使得累积奖励最大。因为需要求解的是累积奖励，所以单纯的贪婪即时奖励最大的策略是不可行的。所以我们引入了能够包含未来奖励的v值（和q值），在与环境的交互过程中，阅读全文

posted @ 2018-10-29 15:20 yijun0730 阅读(212) 评论(0) 推荐(0) 编辑

1. 马尔科夫决策过程

摘要：马尔科夫特性：下一时刻的状态只与现在的时刻的状态相关，与之前的时刻无关，即状态信息包含了历史的所有相关信息。马尔科夫奖励过程，$<S, P, R, \gamma>$： $S$是有限状态集 $P$是状态转移概率矩阵，${p_{ss'}} = {\rm P}[{S_{t + 1}} = s'|{S_ 阅读全文

posted @ 2018-10-25 18:08 yijun0730 阅读(504) 评论(0) 推荐(0) 编辑

梯度下降法、随机梯度下降法、小批量梯度下降法

摘要：本文以二维线性拟合为例，介绍批量梯度下降法、随机梯度下降法、小批量梯度下降法三种方法，求解拟合的线性模型参数。需要拟合的数据集是 $(X_1, y_1), (X_2, y_2)..., (X_n, y_n)$，其中$X^i=(x_1^i, x_2^i)$，表示2个特征，$y^i$是对应的回归值。阅读全文

posted @ 2018-10-24 22:36 yijun0730 阅读(2063) 评论(0) 推荐(2) 编辑

计算曲线与坐标轴的面积

摘要：根据坐标点，计算曲线与坐标轴的面积。 1. trapz函数利用梯度规则（Trapezoidal rule）求解积分。 2. simps函数利用辛普森积分法（Simpson's rule），以二次曲线逼近的方式取代矩形或梯形积分公式，以求得定积分的数值近似解。 3. 利用多边形求解利用Shoel 阅读全文

posted @ 2018-10-15 15:53 yijun0730 阅读(3118) 评论(0) 推荐(0) 编辑

导航