摘要: Sarsa Lambda 此处引出了单步更新和回合更新的概念。 单步更新,每次只学习上一步的信息,即更新的Q只和前一步的Q和下一步的Q有关,与更早的行动无关 而回合更新则是学习一定数量的行动信息,不仅与前一步有关。lambda则是描述步数的参数。0代表默认的sarsa 即只学习前一步。 lambda 阅读全文
posted @ 2020-03-10 02:21 Aitashi 阅读(185) 评论(1) 推荐(0) 编辑
摘要: Sarsa & Q-Learning 根据公示表,似乎Sarsa相对于Q的区别在于,Sarsa的学习更新过程中, Q(s', a')的获取方式与Q(s, a)相同,都是通过类似的epsilon-greedy方法获取的. 而Q-Learning 的思路则是直接抓取s',将其对应的所有action中,选 阅读全文
posted @ 2020-03-04 00:41 Aitashi 阅读(165) 评论(0) 推荐(0) 编辑
摘要: 继续莫烦的教程,这次是迷宫。 与前面的简单例子相比,迷宫的action有四个方向,reward有正有负,整体情况复杂了许多 tkinter是python3中自带的GUI库,在windows下无需手动安装,在linux则不然,需要手动安装python3-tk与tk-dev包才能被python捕捉的 此 阅读全文
posted @ 2020-03-03 22:13 Aitashi 阅读(357) 评论(0) 推荐(0) 编辑
摘要: 研究生方向终于尘埃落定。开始学习RL,计划先看莫烦的视频教程,然后看silver的书。 终究还是没能跑掉深度学习啊,但是能离开模拟电路已经是万幸力。 基本上是相当于学习笔记。 以上。 莫烦RL教程:https://morvanzhou.github.io/tutorials/machine-lear 阅读全文
posted @ 2020-02-26 18:14 Aitashi 阅读(171) 评论(0) 推荐(0) 编辑
摘要: 华东师范大学软件学院真的强哦 院长直接拉来当裁判 还带演示说明的 恭喜 阅读全文
posted @ 2019-12-02 12:57 Aitashi 阅读(298) 评论(0) 推荐(0) 编辑
摘要: 继续学习。10号参加了由官方举办的一次“技术交流沙龙”,实际上就是组办方给自己做宣传,明确了一些问题和技术需求。总而言之,本次比赛是一种开放尝试,并非与银联服务全面对接,而是要找创意,想点子,为银联商务开放平台的建设添砖加瓦。。 回到weex本身。接下来测试了list和scroller等列表元素的使 阅读全文
posted @ 2019-11-13 00:26 Aitashi 阅读(478) 评论(0) 推荐(0) 编辑
摘要: 好几天没有继续学习,日渐荒芜,而终期日近,深刻检讨。。 这次终于开始正式上手weex开发。看了几期技术胖的视频,确实略显古旧,与当前的版本差异较大,基本属于自己矫正的状态。 说到底,weex的开发目前仍然是基于vue的(weel-cli生成的就是vue文件为核心的工程,不过当前版本只支持create 阅读全文
posted @ 2019-11-03 23:45 Aitashi 阅读(485) 评论(0) 推荐(0) 编辑
摘要: 最近参加了银联商务开放平台举办的小程序设计比赛,这对本人来说是全新的技术领域,尝试来记录一下学习过程。由于是以比赛为导向,可能过程比较功利,直接奔着作品来。 比赛网址如下:https://open.chinaums.com/miniprogram/competition/pc 在本人个人的认识中,“ 阅读全文
posted @ 2019-10-27 22:16 Aitashi 阅读(1940) 评论(0) 推荐(0) 编辑
摘要: 恢复内容开始 许久没上博客,已然荒芜(实际上本来也没东西) 现在读了研究生 专业方向不甚喜欢 遂打算重新捡起相关内容 目前在看csapp,了解了一些science surfing(竟然是违禁词)相关内容 下面准备刷刷题 嵌入式也不想放下 (眼高手低 阅读全文
posted @ 2019-10-10 13:27 Aitashi 阅读(144) 评论(0) 推荐(0) 编辑
摘要: Nordic nRF52832蓝牙模块开发学习 阅读全文
posted @ 2017-07-18 21:28 Aitashi 阅读(20009) 评论(1) 推荐(1) 编辑