2011 年 5月随笔档案 - JerryLead

05 2011 档案

增强学习（Reinforcement Learning and Control）

摘要：[pdf版本]增强学习.pdf 在之前的讨论中，我们总是给定一个样本x，然后给或者不给label y。之后对样本进行拟合、分类、聚类或者降维等操作。然而对于很多序列决策或者控制问题，很难有这么规则的样本。比如，四足机器人的控制问题，刚开始都不知道应该让其动那条腿，在移动过程中，也不知道怎么让机器人自动找到合适的前进方向。另外如要设计一个下象棋的AI，每走一步实际上也是一个决策过程，虽然对于简单的棋有A*的启发式方法，但在局势复杂时，仍然要让机器向后面多考虑几步后才能决定走哪一步比较好，因此需要更好的决策方法。对于这种控制决策问题，有这么一种解决思路。我们设计一个回报函数（reward fu 阅读全文

posted @ 2011-05-13 11:19 JerryLead 阅读(81985) 评论(5) 推荐(8) 编辑

因子分析（Factor Analysis）

摘要：【pdf版本】因子分析1 问题之前我们考虑的训练数据中样例的个数m都远远大于其特征个数n，这样不管是进行回归、聚类等都没有太大的问题。然而当训练样例个数m太小，甚至m<<n的时候，使用梯度下降法进行回归时，如果初值不同，得到的参数结果会有很大偏差（因为方程数小于参数个数）。另外，如果使用多元高斯分布(Multivariate Gaussian distribution)对数据进行拟合时，也会有问题。让我们来演算一下，看看会有什么问题：多元高斯分布的参数估计公式如下：分别是求mean和协方差的公式，表示样例，共有m个，每个样例n个特征，因此是n维向量，是n*n协方差矩阵。当m& 阅读全文

posted @ 2011-05-11 15:59 JerryLead 阅读(69292) 评论(17) 推荐(8) 编辑

公告

Contact me via

昵称： JerryLead
园龄： 14年
粉丝： 2920
关注： 5

+加关注

统计

随笔 - 28
文章 - 0
评论 - 470
阅读 - 278万

JerryLead

05 2011 档案

增强学习（Reinforcement Learning and Control）

因子分析（Factor Analysis）

公告

导航

统计

搜索

常用链接

我的标签

积分与排名

随笔档案 (28)

阅读排行榜

评论排行榜

推荐排行榜

最新评论