煦阳 - 博客园

2020年4月5日

摘要： [TOC] ML Agents（五）GridWorld GridWorld这个例子比较有意思，它还是运用了Reinforcement Learning来进行学习的，不同的是它运用了视觉观察值（Visual Observations）来训练agent。如上图所示，Agent就是蓝色的方块，每次它可阅读全文

posted @ 2020-04-05 21:22 煦阳阅读(3827) 评论(8) 推荐(0) 编辑

2020年3月31日

ML-Agents（四）3DBall补充の引入泛化

摘要： [TOC] ML Agents（四）3DBall补充の引入泛化前两天大概研究完3DBall示例，里面的初始化中运用了如下代码：这里面的 m_ResetParams 参数初始化让我没明白到底是干啥用的，今天翻官方文档才发现这里参数的意义，简单来讲其实这里是为了训练出可以适应环境改变的Agent 阅读全文

posted @ 2020-03-31 00:05 煦阳阅读(1731) 评论(2) 推荐(1) 编辑

2020年3月29日

ML-Agents（三）3DBall

摘要： [TOC] ML Agents（三）3DBall例子前一周忙着公司的考试，都没有怎么学新的，今天补上~ 之后的记录，我准备先只研究官方的示例，主要是把研究过程中的疑惑和想法记下来。首先我先补充一下如何利用GPU进行训练，结合（一）中的安装方法，需要CUDA v10.0，cuDNN v7.6.5 阅读全文

posted @ 2020-03-29 00:51 煦阳阅读(2465) 评论(1) 推荐(1) 编辑

2020年3月16日

ML-Agents（二）创建一个学习环境

摘要： [TOC] ML Agents（二）创建一个学习环境一、前言上一节我们讲了如何配置ML Agents环境，这一节我们创建一个示例，主要利用Reinforcement Learning（强化学习）。如上图，本示例将训练一个球滚动找到随机放置的立方体，而且要避免从平台上掉下去。本示例是基于ML 阅读全文

posted @ 2020-03-16 22:51 煦阳阅读(5702) 评论(3) 推荐(4) 编辑

2020年3月15日

数据结构（一）—链表

摘要： [TOC] 一、背景作为机械狗转行，数据结构当然是不可缺少的，疫情假期里闲来在家无事，刚好接下给小孩教数据结构的活，所以自学了简单的数据结构用法，算是数据结构的入门吧。做个笔记记下来，其实平常喜欢用思维导图进行记录，这算复习一遍，所以再用MarkDown进行记录，顺便发个博。话不多说，今天先来记阅读全文

posted @ 2020-03-15 18:02 煦阳阅读(774) 评论(0) 推荐(0) 编辑

2020年3月9日

[2020.03]Unity ML-Agents v0.15.0（一）环境部署与试运行

摘要： [20200318更新]注意：之前关于下载CUDA与cuDNN的版本我写错了，首先道个歉。如果要想用Tensorflow利用GPU进行训练，就需要Tensorflow、CUDA、cuDNN的版本对应一致。之前我弄错了！我们后面用的Tensorflow的版本是2.0.1，所以对应CUDA的版本应该是C 阅读全文

posted @ 2020-03-09 22:57 煦阳阅读(6211) 评论(8) 推荐(6) 编辑

煦阳

公告