| | | |

2017年8月14日

【论文阅读-DL】《One Model To Learn Them All》阅读

摘要：概念：One/Zero-shot learning 训练集中没有样本的学习；和transfer learning/domain adoption有关 NN很成功，但是每个领域都有自己的model；本文尝试搞一个统一的模型之前也有人尝试过NLP/语音识别/人脸检测的多任务学习，但是不是跨域地目前的阅读全文

posted @ 2017-08-14 06:00 _1024 阅读(164) 评论(0) 推荐(0) 编辑

强化学习(David Silver)2：MDP

摘要： 1、MP(马尔科夫过程) 1.1、MDP介绍 1）MDP形式化地表达强化学习的过程(此时假设环境完全可以观察) 2) 几乎所有强化学习问题都可以形式化为MDP 1.2、MDP定义 MDP是一个二元组<S，P>，其中S是状态集合；P是状态转移概率 2、MRP(马尔科夫奖励过程) 在MP中加入了Rewa 阅读全文

posted @ 2017-08-14 05:15 _1024 阅读(656) 评论(0) 推荐(0) 编辑