【回归】记Paddle强化学习训练营
回到博客园,上次发博已是5年,不曾想,机缘巧合,以参加一次Paddle训练营心得来回归博客园。
偶然收到百度Paddle强化学习7日训练营邮件,心想研究生期间也曾学习过一段时间(不过一知半解),颇想进一步学习下并有有所实践,暗合我意。
心想:虽然大部分时间要上班,这7天时间不长,应该很好坚持下来吧。
第一堂课,我打开B站,想不到这里真的是学习的,内容比较基础,容易上手,需要对AI Studio平台进行适应学习,但这仅仅是强化学习的开始。
第二堂课,我的老本在第一堂课基本就用完了。由于晚上8点半太早,没来不及看直播,如果第二天早上我没有看视频做作业的话,我想7天打卡也就会终于第2天吧。
之后的几天都是早早到公司看昨天的录像、做作业,想想工作2年来,还没有这样赶着快点到公司来的经历,不得不定下当日的list,防止影响工作。这感觉真的很棒。
最后一个作业,是做四轴飞行器的电压调节,训练了好几小时总是不收敛、收益为负。
调试方法也是不得章法:不知道这网络层数、超参数(学习率、回报衰减等)到底是不是影响结果的原因,东一榔头西一锤头的乱试,每次还要等好久才能看出趋势,心想炼丹此言不虚啊。
因为没有实践过深度学习,训练效果不好,很是苦恼,但这也许会给我内心种下一个种子,想要把深度学习也弄明白。
最好,看到微信群里,同学们讨论说老师有提到,直观上讲:四轴飞行器电压尽量接近才更可能平衡,瞬间恍然大悟,迫不及待想再试一把。
没想到,收益很快就变成了正数,并且越来越大。心中窃喜,页再次体会到:思路和方法真的更加重要。
感谢这套课程,课程中,科科老师讲解详略得当,抓住要点,在1h的课程让人迫不及待想去试试,感谢,也感谢芮芮老师的组织和提醒。
后面附上自己学习笔记,由于是手写的,只能上传照片了。