2019年11月14日
摘要: 论文信息: Nichol A , Achiam J , Schulman J . On First-Order Meta-Learning Algorithms[J]. 2018. 摘要 文章从一个任务分布中抽取许多任务来训练元学习模型,使其可以更快的学习这个分布中未遇到的任务。 仅在元学习更新过程 阅读全文
posted @ 2019-11-14 17:46 筱筱蛋坑 阅读(1130) 评论(0) 推荐(0) 编辑
  2019年11月13日
摘要: 原文部分 摘要: 元学习算法与模型无关,兼容任何梯度下降训练的模型,适用于分类、回归和强化等。 元学习的目标是用大量任务训练一个模型,使它可以通过少量训练样本解决新的任务。 模型参数被显式训练,少量样本下少量梯度步长就能在新任务上产生良好的泛化性能。实际是将模型训练得易于微调。 亮点:1、小样本集的 阅读全文
posted @ 2019-11-13 12:23 筱筱蛋坑 阅读(338) 评论(0) 推荐(0) 编辑
摘要: ⭕ 强化学习整合算法Rainbow 阅读全文
posted @ 2019-11-13 09:32 筱筱蛋坑 阅读(80) 评论(0) 推荐(0) 编辑
  2019年11月12日
摘要: 元学习试图根据性能做出响应,从而对模型结构以及参数空间进行修改,在新环境中利用之前积累的经验。 人类大脑针对某项任务的工具和能力是什么?元学习研究者提出两种理论与这些工具相关: 1、学习的先验:人类可以利用过去任务中学到的信息,很快的学会新任务。例如物理知识或掉血奖励等; 2、学习的策略:人类收集到 阅读全文
posted @ 2019-11-12 18:11 筱筱蛋坑 阅读(291) 评论(0) 推荐(0) 编辑
  2019年11月11日
摘要: 摘要: 特征的寻找已取得巨大成功,从手工设计到机器自己学习。但是优化算法仍依靠人工设计,这篇文章试图将优化算法的设计转换成一个学习问题。借用LSTM实现学习算法,在训练任务上优于通用人工设计方法,且可推广到相似结构的新任务。这种方法适用于多种问题,例如简易凸优化、训练神经网络、 用神经学设计图像等。 阅读全文
posted @ 2019-11-11 12:05 筱筱蛋坑 阅读(1356) 评论(0) 推荐(0) 编辑
  2019年11月6日
摘要: 何为meta learning Meta learning的初衷是learning to learn,即学会学习。对比于依赖巨量训练的增强学习,元学习能够充分利用知识快速指导新任务学习,是通用人工智能的关键。 元学习的主要挑战是以系统的、数据驱动的方式从先前的经验中学习。首先,需要收集描述先前学习任 阅读全文
posted @ 2019-11-06 15:08 筱筱蛋坑 阅读(759) 评论(0) 推荐(1) 编辑
摘要: 机器智能程度三阶段:运动--思考--情感 第1级:机器人具备基本的运动能力,语言能力和视觉能力,能够按照人类的命令去处理一些外在的多样任务,比如扫地,擦桌子,倒垃圾等等。机器人不具备思考能力,是完全的人类仆人。比如只知道执行任务的机器人瓦力(不考虑电影中有意识的部分)。 第2级:机器人具备思考能力, 阅读全文
posted @ 2019-11-06 10:08 筱筱蛋坑 阅读(399) 评论(0) 推荐(0) 编辑