会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
_1024
Powered by
博客园
博客园
|
首页
|
新随笔
|
联系
|
订阅
|
管理
2017年8月14日
【论文阅读-DL】《One Model To Learn Them All》阅读
摘要: 概念:One/Zero-shot learning 训练集中没有样本的学习;和transfer learning/domain adoption有关 NN很成功,但是每个领域都有自己的model;本文尝试搞一个统一的模型 之前也有人尝试过NLP/语音识别/人脸检测的多任务学习,但是不是跨域地 目前的
阅读全文
posted @ 2017-08-14 06:00 _1024
阅读(164)
评论(0)
推荐(0)
编辑
强化学习(David Silver)2:MDP
摘要: 1、MP(马尔科夫过程) 1.1、MDP介绍 1)MDP形式化地表达强化学习的过程(此时假设环境完全可以观察) 2) 几乎所有强化学习问题都可以形式化为MDP 1.2、MDP定义 MDP是一个二元组<S,P>,其中S是状态集合;P是状态转移概率 2、MRP(马尔科夫奖励过程) 在MP中加入了Rewa
阅读全文
posted @ 2017-08-14 05:15 _1024
阅读(656)
评论(0)
推荐(0)
编辑