强化学习:softlearning 算法的官方实现 —— 源码阅读list(完成)

softlearning原始项目:

https://github.com/rail-berkeley/softlearning


国内地址:

https://openi.pcl.ac.cn/devilmaycry812839668/softlearning



相关:

强化学习:人形机器人 —— soft-q-leanring的官方实现的配置环境


原始项目的运行环境已经打包成docker镜像,分布地址:

https://gpushare.com/

image



源码阅读list:

scripts:(1个,完成)

​ console_scripts.py

misc:(2个,完成)

​ plotter.py

​ kernel.py

preprocessors:(1个,完成)

utils: (13个,完成)

​ dict.py

​ gcp.py

​ git.py

​ gym.py

​ misc.py

​ numpy.py

​ random.py

​ serialization_test.py

​ serialization.py

​ tensorflow.py

​ times.py

​ tune.py

​ video.py

value_functions:(3个,完成)

softlearning/models:(4个,完成)

softlearning/policies:(9个,完成)

distributions:(完成)

​ bijectors/conditional_shift.py

​ bijectors/conditional_scale.py

softlearning/samplers:(完成)

softlearning/replay_pools:(完成)

environments/utils.py:(完成)

softlearning/algorithms



posted on   Angry_Panda  阅读(11)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 周边上新:园子的第一款马克杯温暖上架
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· DeepSeek如何颠覆传统软件测试?测试工程师会被淘汰吗?
· 使用C#创建一个MCP客户端
历史上的今天:
2023-12-18 域名所有权验证 —— DNS TXT 域名验证
2023-12-18 如何配置域名的 CNAME —— 添加记录集时,为什么会提示“与已有解析记录冲突”?
2023-12-18 访问网站报错:已备案未接入
2023-12-18 绑定国内主机IP的域名网站必须要备案
2023-12-18 波士顿机器人拿枪射击是真是假?视频是如何拍摄制作的?其实是有真人录制,然后通过后期特效制作而成
2023-12-18 企业级路由器上是一个网卡对应一个网段吗???
2023-12-18 如何构建一个高速的局域网 —— 第一步先有个高速网卡

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示