牛马日记

好了一下子研一了,又高兴地玩了四年

主要记录一下一些进展,包括不限于代码调试读论文做实验

目前方向大概是RL,LLM,Robotics

发现现在博客园实时预览的markdown挺好用,不用像之前一样编辑发表来回切换(也有可能是之前没看见这个

感觉深度学习的基础很差(其实根本没有),打算最近看几篇经典论文稍微学习一下,不过暂时不做这个应该不会在代码上下很大功夫。感觉跟李沐学ai可能是个好东西,虽然没怎么看,但是图书馆走了一圈好几个人都在看那个,可惜我看网课就想睡觉。强化学习最近一直在做实验,不过是零基础直接上手,训练了一堆像文明六一样的东西,最近应该会具体看一下理论。

论文阅读计数
0/105

9.5

满怀信心想大干一场,打开论文发现不知道全连接层是干啥的

先读了一下Alex Net的论文,感觉对这种论文不太会读,可能是当时这篇论文的结果太好了就没有在论文中仔细讲故事了,看了看网络结构,当然主要是熟悉一下各个layer都是干啥的

又看了一下VGG Net的论文,主要看了一下网络结构,这篇花了一些篇幅讲故事,training什么的还是没怎么看

又看了一下Google Net的论文,囫囵吞枣看看,想巩固一下全连接层的概念结果压根没有全连接层

感觉读论文是一个不错的学习方式,看到不懂的概念再去查资料,比直接上教材网课什么的舒服一些(也可能是不用敲代码

明天想主要看一点强化学习理论方面的论文,然后看看LLM Fine-tuning的内容

9.6

上午读了一下ResNet和Attention Is All You Need,感觉这种经典老论文还是好读的,过一遍翻译再找几个博客看看大概都能知道讲了什么,反正暂时不搞深度学习,简单看看有个印象吧,明天看看那个什么BERT是什么东西

下午晚上打篮球去了,白费

9.7

上午还是看了看Transformer,巩固了一下,感觉还是理解不够深刻啊

下午干了一会主业,读了一会Isaac Gym代码,看看怎么改改command

9.8

修改了一下legged gym代码,代码相关性太高了很麻烦啊,好多修改改完又被重载掉了

9.9

改了改训练了训练又是一天,明天得开始搞搞强化学习算法方面的东西了

之前做的东西不着急发又可以松一点,不过说要加进去一些力学的东西进去,也得慢慢研究一下

9.10

休息一天

9.11

看了一个最古早的强化学习论文

准备跟着这个网站(https://spinningup.openai.com/en/latest/spinningup/keypapers.html)上边的顺序先看一些比较基础的论文,感觉最近主要会看这上边的,开个计数

posted @ 2024-09-05 15:31  Slr  阅读(6)  评论(0编辑  收藏  举报