• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 众包
  • 赞助商
  • YouClaw
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






_1024

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理

10 2017 档案

 
强化学习 Note
摘要:1、这篇note来自https://www.zybuluo.com/tinadu/note/629229 1.1、初步 作者认为,DRL可以用于解决通用人工智能问题,通用人工智能包含3部分: 通用任务:解决一般性任务,减少对领域知识的依赖;非线性的神经网络可以表征这一问题; 学习能力:学习分为归纳和 阅读全文
posted @ 2017-10-30 18:46 _1024 阅读(463) 评论(0) 推荐(0)
强化学习(David Silver)9:探索与利用
摘要:1、介绍 1.1、探索方案的策略 1) 随机探索 2) 面对不确定性保持乐观: 估计不确定的值; 选择不确定最大的探索 3) 信息状态空间: 把代理的信息看做值的一部分; 考虑那些有助于提高reward的收益 1.2、探索的方式 1) 在状态-动作空间泰索 2) 在参数空间探索 优势: 连续探索 劣 阅读全文
posted @ 2017-10-23 19:04 _1024 阅读(1685) 评论(0) 推荐(0)
强化学习(David Silver)8:集成学习和计划
摘要:1、介绍 这课中的规划就是预测 1.1、Model-Based的两层含义 agent学习环境从一个状态向另一个状态的转移 agent学习状态转移收益 ps: model的学习主体是agent 1.2、利弊 利: 通过监督学习高效学习; 解释model的不确定原因 弊: 学习模型+构造值函数, 叠加两 阅读全文
posted @ 2017-10-22 23:25 _1024 阅读(985) 评论(0) 推荐(0)
强化学习(David Silver)7:策略梯度算法
摘要:1、简介 1.1、PolicyBased方法优劣 优势: 更好的收敛特性 在高维或者连续的action空间里面有效 可以学习随机策略 劣势: 收敛到局部最优,而非全局最优 policy估计训练慢、高方差,有时候没有值函数有效:ValueBased方法使用Max贪心优化跑得快; 策略梯度方法在梯度方向 阅读全文
posted @ 2017-10-20 19:52 _1024 阅读(1757) 评论(0) 推荐(0)
数学基础01-最优化(梯度下降法、牛顿法、拟牛顿法等)
摘要:1、最优化问题分类 按照约束条件分,可以分为:无约束优化问题、有不等式优化问题、有不等式优化问题。 按照是否线性,可以分为线性优化问题(目标函数和约束均线性)、非线性优化问题(目标函数和约束中任意部分非线性)。 按是否凸,可以分为凸优化问题、非凸优化问题。 对于有约束优化问题,常见的做法是转换到无约 阅读全文
posted @ 2017-10-16 22:08 _1024 阅读(2537) 评论(0) 推荐(1)
基础模型10-word2vec
摘要:1、word2vec 1.1、Skip-Gram/Cbow 1.2、HS/NE 2、文本中的paramGraph2Vec 3、电商中的user2vec/item2Vec 4、网络中的Node2vec 5、Glove 阅读全文
posted @ 2017-10-16 21:53 _1024 阅读(150) 评论(0) 推荐(0)
基础模型09-pLSA+LDA
摘要:这个不用多说啦。大家都懂的。模型求解非常有意思。 阅读全文
posted @ 2017-10-16 21:52 _1024 阅读(152) 评论(0) 推荐(0)
ML基础06-数据不平衡问题
摘要:0、什么是数据不平衡问题 在机器学习的分类问题中,不同类别的样本数据量存在差异。在某些场景,比如网页点击率预估(网页点击率低),购物推荐(浏览产生的购买少),信用卡欺诈,网络攻击识别等,这种差异可能会较大。传统的学习算法,对不同类别的数据一视同仁地处理,会产生在多数类样本效果较好,但是在少数类样本上 阅读全文
posted @ 2017-10-16 21:35 _1024 阅读(411) 评论(0) 推荐(0)
ML 100问
摘要:准备整理自己关于ML的思考和理解,长期迭代,整理出100个自己认为的重要问题来。 180823:ABTest为什么使用Z检验?不用卡方检验? http://webdataanalysis.net/data-analysis-method/t-test-and-chi-square-test/这篇文章 阅读全文
posted @ 2017-10-16 17:10 _1024 阅读(433) 评论(0) 推荐(0)