Volcano3511 - 博客园

智能规划发展趋势

摘要：规划算法/思想规划语言动作表示规划和执行规划的发展趋势攻击规划的发展趋势参考文献TOC 规划算法/思想 1975年之前，大部分是状态空间规划 1975年之后，出现了一些局部规划空间规划，规划空间中的点变成了局部规划之后出现了 action-ordering 表示方法，这种规划方法描述的是 acti 阅读全文

posted @ 2019-11-07 17:30 Volcano3511 阅读(200) 评论(0) 推荐(0) 编辑

icais2020投稿要求

摘要： Paper Submission All submissions must be in English. The papers should have 10~12 LNCS pages in length, including figures and references. Authors shou 阅读全文

posted @ 2019-11-07 17:29 Volcano3511 阅读(1021) 评论(0) 推荐(0) 编辑

有趣的机器学习视频-第四章.强化学习

摘要： 4.14.24.3 什么是Q learning4.4 sarsa4.5 Sarsa λ4.6 DQN4.8 Actor critic4.9 DDPG4.10 A3C4.11 AlphaGo ZeroTOC 4.1 强化学习——一开始什么都不知道通过采取action之后得到的分数来进行学习——具有分阅读全文

posted @ 2019-11-07 17:28 Volcano3511 阅读(175) 评论(0) 推荐(0) 编辑

有趣的机器学习视频-第五章.进化算法

摘要： 5.1 什么是遗传算法5.2 进化策略5.2 神经网络进化TOC 5.1 什么是遗传算法用二进制表示个体 5.2 进化策略用遗传信息和变异产生个体，然后通过适者生存进行不再使用01表示，这些实数可以看做是某些待优化目标函数的参数值同样可以用遗传，但是如何产生变异？变异强度：将双方的值取均值阅读全文

posted @ 2019-11-07 17:28 Volcano3511 阅读(305) 评论(0) 推荐(0) 编辑

有趣的机器学习视频-第二章.人工神经网络

摘要： 2.2 什么是神经网络RNNLSTM RNN2.6 自编码autocoder2.7 GAN2.82.10 站在巨人的肩膀上，迁移学习TOC 2.2 什么是神经网络长宽减少，高度增加常见结构： RNN 解决输入数据之间有前后关联的——记住之前发生的东西 RNN有很多形式应用：描述照片，翻译，作曲阅读全文

posted @ 2019-11-07 17:27 Volcano3511 阅读(123) 评论(0) 推荐(0) 编辑

有趣的机器学习视频-第三章.如何评价/检验神经网络

摘要： 3.1 如何检验3.2 特征标准化3.3 如何辨别好特征3.4 激励函数3.5 过拟合3.6 加速神经网络训练过程传统的w的更新方法：momentum：引入一定的惯性AdaGrad：在学习率上面修正，使得越弯曲，学习率越低RMSPropAdam处理不均衡数据batch normalizationL1 阅读全文

posted @ 2019-11-07 17:27 Volcano3511 阅读(190) 评论(0) 推荐(0) 编辑

有趣的机器学习视频-第一章.什么是机器学习

摘要：机器学习方法TOC 机器学习方法有监督学习：输入的数据有标签无监督学习：输入的数据没有标签半监督学习：用少量的有标签数据来进行学习强化学习：规划机器人行为准则方法，从经验中不断学习，总结遗传算法：模拟进化理论，通过淘汰机制阅读全文

posted @ 2019-11-07 17:26 Volcano3511 阅读(82) 评论(0) 推荐(0) 编辑

AlphaStar

摘要：自以围棋为代表的完全信息博弈/游戏被 AlphaGo 攻克、取得超出人类顶尖棋手的水平之后，研究人员们立刻向非完全信息博弈发起更加猛烈的进攻。典型的非完全信息博弈比如德州扑克，玩家需要在看不到对手的牌面的状况下做出决策，CMU 的德扑 AI 论文也拿到了 NIPS 2017 的最佳论文奖。虽然都是阅读全文

posted @ 2019-11-07 17:24 Volcano3511 阅读(391) 评论(0) 推荐(0) 编辑

AlphaZero

摘要：一图解密AlphaZero初步认识AlphaGo Zero原理AlphaGo Zero的核心特点可以表述为：AlphaGo Zero概述AlphaGo Zero 背后的强化学习算法TOC 一图解密AlphaZero https://blog.csdn.net/ikerpeng/article/det 阅读全文

posted @ 2019-11-07 17:24 Volcano3511 阅读(1006) 评论(0) 推荐(0) 编辑

AlphaGo分析

摘要： Lessions learned from AlphaGoAlphaGo的分析AlphaGo这个系统主要由几个部分组成：1.走棋网络：2. 快速走子3. 估值网络4. 蒙特卡罗树搜索TOC Lessions learned from AlphaGo 首先可以看一下这篇论文，对于MCTR与神经网络的结阅读全文

posted @ 2019-11-07 17:21 Volcano3511 阅读(359) 评论(0) 推荐(0) 编辑