会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
煦阳
博客园
首页
新随笔
联系
管理
订阅
上一页
1
2
2020年4月5日
ML-Agents(五)GridWorld
摘要: [TOC] ML Agents(五)GridWorld GridWorld这个例子比较有意思,它还是运用了Reinforcement Learning来进行学习的,不同的是它运用了视觉观察值(Visual Observations)来训练agent。 如上图所示,Agent就是蓝色的方块,每次它可
阅读全文
posted @ 2020-04-05 21:22 煦阳
阅读(3827)
评论(8)
推荐(0)
编辑
2020年3月31日
ML-Agents(四)3DBall补充の引入泛化
摘要: [TOC] ML Agents(四)3DBall补充の引入泛化 前两天大概研究完3DBall示例,里面的初始化中运用了如下代码: 这里面的 m_ResetParams 参数初始化让我没明白到底是干啥用的,今天翻官方文档才发现这里参数的意义,简单来讲其实这里是为了训练出可以适应环境改变的Agent
阅读全文
posted @ 2020-03-31 00:05 煦阳
阅读(1731)
评论(2)
推荐(1)
编辑
2020年3月29日
ML-Agents(三)3DBall
摘要: [TOC] ML Agents(三)3DBall例子 前一周忙着公司的考试,都没有怎么学新的,今天补上~ 之后的记录,我准备先只研究官方的示例,主要是把研究过程中的疑惑和想法记下来。首先我先补充一下如何利用GPU进行训练,结合(一)中的安装方法,需要CUDA v10.0,cuDNN v7.6.5
阅读全文
posted @ 2020-03-29 00:51 煦阳
阅读(2465)
评论(1)
推荐(1)
编辑
2020年3月16日
ML-Agents(二)创建一个学习环境
摘要: [TOC] ML Agents(二)创建一个学习环境 一、前言 上一节我们讲了如何配置ML Agents环境,这一节我们创建一个示例,主要利用Reinforcement Learning(强化学习)。 如上图,本示例将训练一个球滚动找到随机放置的立方体,而且要避免从平台上掉下去。 本示例是基于ML
阅读全文
posted @ 2020-03-16 22:51 煦阳
阅读(5702)
评论(3)
推荐(4)
编辑
2020年3月15日
数据结构(一)—链表
摘要: [TOC] 一、背景 作为机械狗转行,数据结构当然是不可缺少的,疫情假期里闲来在家无事,刚好接下给小孩教数据结构的活,所以自学了简单的数据结构用法,算是数据结构的入门吧。做个笔记记下来,其实平常喜欢用思维导图进行记录,这算复习一遍,所以再用MarkDown进行记录,顺便发个博。 话不多说,今天先来记
阅读全文
posted @ 2020-03-15 18:02 煦阳
阅读(774)
评论(0)
推荐(0)
编辑
2020年3月9日
[2020.03]Unity ML-Agents v0.15.0(一)环境部署与试运行
摘要: [20200318更新]注意:之前关于下载CUDA与cuDNN的版本我写错了,首先道个歉。如果要想用Tensorflow利用GPU进行训练,就需要Tensorflow、CUDA、cuDNN的版本对应一致。之前我弄错了!我们后面用的Tensorflow的版本是2.0.1,所以对应CUDA的版本应该是C
阅读全文
posted @ 2020-03-09 22:57 煦阳
阅读(6211)
评论(8)
推荐(6)
编辑
上一页
1
2
公告