筱筱蛋坑 - 博客园

2019年11月14日

【Meta learning】Reptile: a Scalable Metalearning Algorithm

摘要：论文信息： Nichol A , Achiam J , Schulman J . On First-Order Meta-Learning Algorithms[J]. 2018. 摘要文章从一个任务分布中抽取许多任务来训练元学习模型，使其可以更快的学习这个分布中未遇到的任务。仅在元学习更新过程阅读全文

posted @ 2019-11-14 17:46 筱筱蛋坑阅读(1130) 评论(0) 推荐(0) 编辑

2019年11月13日

【Meta learning】MAML笔记

摘要：原文部分摘要：元学习算法与模型无关，兼容任何梯度下降训练的模型，适用于分类、回归和强化等。元学习的目标是用大量任务训练一个模型，使它可以通过少量训练样本解决新的任务。模型参数被显式训练，少量样本下少量梯度步长就能在新任务上产生良好的泛化性能。实际是将模型训练得易于微调。亮点：1、小样本集的阅读全文

posted @ 2019-11-13 12:23 筱筱蛋坑阅读(338) 评论(0) 推荐(0) 编辑

待读文章

摘要： ⭕ 强化学习整合算法Rainbow 阅读全文

posted @ 2019-11-13 09:32 筱筱蛋坑阅读(80) 评论(0) 推荐(0) 编辑

2019年11月12日

【Meta learning】综述

摘要：元学习试图根据性能做出响应，从而对模型结构以及参数空间进行修改，在新环境中利用之前积累的经验。人类大脑针对某项任务的工具和能力是什么？元学习研究者提出两种理论与这些工具相关： 1、学习的先验：人类可以利用过去任务中学到的信息，很快的学会新任务。例如物理知识或掉血奖励等； 2、学习的策略：人类收集到阅读全文

posted @ 2019-11-12 18:11 筱筱蛋坑阅读(291) 评论(0) 推荐(0) 编辑

2019年11月11日

【Meta learning】Learning to learn by gradient descent by gradient descent (Nips2016)

摘要：摘要：特征的寻找已取得巨大成功，从手工设计到机器自己学习。但是优化算法仍依靠人工设计，这篇文章试图将优化算法的设计转换成一个学习问题。借用LSTM实现学习算法，在训练任务上优于通用人工设计方法，且可推广到相似结构的新任务。这种方法适用于多种问题，例如简易凸优化、训练神经网络、用神经学设计图像等。阅读全文

posted @ 2019-11-11 12:05 筱筱蛋坑阅读(1356) 评论(0) 推荐(0) 编辑

2019年11月6日

【Meta-learning】入门

摘要：何为meta learning Meta learning的初衷是learning to learn，即学会学习。对比于依赖巨量训练的增强学习，元学习能够充分利用知识快速指导新任务学习，是通用人工智能的关键。元学习的主要挑战是以系统的、数据驱动的方式从先前的经验中学习。首先，需要收集描述先前学习任阅读全文

posted @ 2019-11-06 15:08 筱筱蛋坑阅读(759) 评论(0) 推荐(1) 编辑

机器发展阶段

摘要：机器智能程度三阶段：运动--思考--情感第1级：机器人具备基本的运动能力，语言能力和视觉能力，能够按照人类的命令去处理一些外在的多样任务，比如扫地，擦桌子，倒垃圾等等。机器人不具备思考能力，是完全的人类仆人。比如只知道执行任务的机器人瓦力（不考虑电影中有意识的部分）。第2级：机器人具备思考能力，阅读全文

posted @ 2019-11-06 10:08 筱筱蛋坑阅读(399) 评论(0) 推荐(0) 编辑