posted @ 2019-11-07 17:30 Volcano3511 阅读(200) 评论(0) 推荐(0) 编辑
摘要:
规划算法/思想规划语言动作表示规划和执行规划的发展趋势攻击规划的发展趋势参考文献TOC 规划算法/思想 1975年之前,大部分是状态空间规划 1975年之后,出现了一些局部规划空间规划,规划空间中的点变成了局部规划 之后出现了 action-ordering 表示方法,这种规划方法描述的是 acti 阅读全文
摘要:
Paper Submission All submissions must be in English. The papers should have 10~12 LNCS pages in length, including figures and references. Authors shou 阅读全文
posted @ 2019-11-07 17:29 Volcano3511 阅读(1021) 评论(0) 推荐(0) 编辑
摘要:
4.14.24.3 什么是Q learning4.4 sarsa4.5 Sarsa λ4.6 DQN4.8 Actor critic4.9 DDPG4.10 A3C4.11 AlphaGo ZeroTOC 4.1 强化学习——一开始什么都不知道 通过采取action之后得到的分数来进行学习——具有分 阅读全文
posted @ 2019-11-07 17:28 Volcano3511 阅读(175) 评论(0) 推荐(0) 编辑
摘要:
5.1 什么是遗传算法5.2 进化策略5.2 神经网络进化TOC 5.1 什么是遗传算法 用二进制表示个体 5.2 进化策略 用遗传信息和变异产生个体,然后通过适者生存进行 不再使用01表示,这些实数可以看做是某些待优化目标函数的参数值 同样可以用遗传,但是如何产生变异? 变异强度:将双方的值取均值 阅读全文
posted @ 2019-11-07 17:28 Volcano3511 阅读(305) 评论(0) 推荐(0) 编辑
摘要:
2.2 什么是神经网络RNNLSTM RNN2.6 自编码autocoder2.7 GAN2.82.10 站在巨人的肩膀上,迁移学习TOC 2.2 什么是神经网络 长宽减少,高度增加 常见结构: RNN 解决输入数据之间有前后关联的——记住之前发生的东西 RNN有很多形式 应用:描述照片,翻译,作曲 阅读全文
posted @ 2019-11-07 17:27 Volcano3511 阅读(123) 评论(0) 推荐(0) 编辑
摘要:
3.1 如何检验3.2 特征标准化3.3 如何辨别好特征3.4 激励函数3.5 过拟合3.6 加速神经网络训练过程传统的w的更新方法:momentum:引入一定的惯性AdaGrad:在学习率上面修正,使得越弯曲,学习率越低RMSPropAdam处理不均衡数据batch normalizationL1 阅读全文
posted @ 2019-11-07 17:27 Volcano3511 阅读(190) 评论(0) 推荐(0) 编辑
摘要:
机器学习方法TOC 机器学习方法 有监督学习:输入的数据有标签 无监督学习:输入的数据没有标签 半监督学习:用少量的有标签数据来进行学习 强化学习:规划机器人行为准则方法,从经验中不断学习,总结 遗传算法:模拟进化理论,通过淘汰机制 阅读全文
posted @ 2019-11-07 17:26 Volcano3511 阅读(82) 评论(0) 推荐(0) 编辑
摘要:
自以围棋为代表的完全信息博弈/游戏被 AlphaGo 攻克、取得超出人类顶尖棋手的水平之后,研究人员们立刻向非完全信息博弈发起更加猛烈的进攻。典型的非完全信息博弈比如德州扑克,玩家需要在看不到对手的牌面的状况下做出决策,CMU 的德扑 AI 论文也拿到了 NIPS 2017 的最佳论文奖。 虽然都是 阅读全文
posted @ 2019-11-07 17:24 Volcano3511 阅读(391) 评论(0) 推荐(0) 编辑