摘要:
https://sites.google.com/view/humanoid-gym/ 阅读全文
摘要:
https://research.nvidia.com/labs/gear/ 阅读全文
摘要:
https://github.com/dragen1860?tab=repositories https://github.com/awjuliani?tab=repositories https://github.com/katerakelly?tab=repositories https://g 阅读全文
摘要:
论文: LEARNING VISION-GUIDED QUADRUPEDAL LOCOMOTION END-TO-END WITH CROSS-MODAL TRANSFORMERS 发表于ICLR2022 相关: https://zhuanlan.zhihu.com/p/581786377 阅读全文
摘要:
论文地址: https://arxiv.org/abs/2010.11929 Github地址: https://github.com/google-research/vision_transformer 阅读全文
摘要:
项目地址: https://openai.com/index/clip Github代码地址: https://github.com/openai/CLIP 阅读全文
摘要:
https://www.understandingai.org/p/large-language-models-explained-with https://arxiv.org/abs/1905.05950 https://arxiv.org/abs/2012.14913 https://arxiv 阅读全文
摘要:
地址: https://github.com/ikostrikov/pytorch-a2c-ppo-acktr-gail 阅读全文
摘要:
GitHub地址: https://github.com/mit-han-lab/efficientvit#usage 相关: https://www.jetson-ai-lab.com/vit/tutorial_efficientvit.html 阅读全文
摘要:
地址: https://developer.nvidia.com/isaac-gym 过期代码库地址:(已不再维护的代码库,现已由isaac gym项目合并到isaac sim项目)(2022年开始停止维护)(强化学习算法代码库) https://github.com/NVIDIA-Omnivers 阅读全文
摘要:
项目地址: https://mobile-aloha.github.io/ 演示视频地址: https://www.youtube.com/watch?v=HaaZ8ss-HP4 论文地址: https://mobile-aloha.github.io/resources/mobile-aloha. 阅读全文
摘要:
地址: https://lucho1.github.io/JumpPointSearch/ 原作者还开发了A* 算法的Windows系统上的小程序:(重点:小程序意义不大,这个综述还是不赖的) 项目地址:https://github.com/lucho1/JumpPointSearch 重点: 这个 阅读全文
摘要:
地址: http://mapf.info/index.php/Main/Publications 与其对应的实验室地址: https://www.movingai.com/ 阅读全文
摘要:
相关: https://www.youtube.com/watch?v=TctNb7DPRtA 人类的真实数据的收集: 人类通过远程控制器实时的控制机器人操作,并且将机器人的操作数据记录下来。 注意: 这里虽然是使用人类的真实操作数据,但是其实是人类操纵机器人执行动作后的数据,这部分真实物理世界下的 阅读全文
摘要:
原文地址: https://mp.weixin.qq.com/s/Z-U4EO6FCF703yMwHXAq5A 随着深度学习和强化学习在机器人学领域的迅猛发展,尤其是大型语言模型的创新进步,具身人工智能系统正以其感知、交互和自主导航的能力,预示着对家庭机器人技术等多个领域的革命性变革。因此我们联合英 阅读全文
摘要:
一个价格还算OK的云GPU服务器租赁公司。 地址: https://www.gpushare.com/ 阅读全文
摘要:
视频地址: 周志华团队与Intel团队的讲座视频——强化学习的局限性与未来展望 视频链接地址: https://bizwebcast.smarket.com.cn/b975d6d9969a42cba9626adb7669676b/2a1fc2d76a65403cb76f99acd5b025da-8a 阅读全文
摘要:
https://github.com/boulanni/theano-hf https://people.duke.edu/~hpgavin/ExperimentalSystems/lm.pdf https://en.wikipedia.org/wiki/Levenberg%E2%80%93Marq 阅读全文
摘要:
作为reinforcement learning的一个入门学习的项目,spinningup的地址: (英文原版:) https://spinningup.openai.com/en/latest/index.html (中文翻译版:) https://spinningup.readthedocs.i 阅读全文
摘要:
相关: 【转载】 推荐算法之Thompson(汤普森)采样 【转载】 推荐系统 EE 问题与 Bandit 算法 python语言绘图:绘制一组beta分布图 转载: beta分布介绍 python语言绘图:绘制一组以beta分布为先验,以二项分布为似然的贝叶斯后验分布图 深入理解什么是Beta分布 阅读全文
2024年11月5日
摘要:
title: 强化学习训练过程中的过度拟合(overfitting) description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 相关: A.I. Learns to Drive From Scratch in 阅读全文
摘要:
title: 如何将强化学习问题转换为监督学习问题 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 相关: A.I. teaches itself to drive in Trackmania 如何 阅读全文
摘要:
title: 如何使用强化学习算法解决贪吃蛇问题(Neural Network Learns to Play Snake) description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 相关: Neural Ne 阅读全文
摘要:
title: 应不应该研发垂直起降战斗机 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 虽然我是搞machine learning research的,但是由于比较水,而且平时也比较水,所以喜欢看 阅读全文
摘要:
title: 强化学习算法中基于值的和基于策略梯度的两类算法到底哪个速度更快 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 有人说基于值的RL算法收敛速度快,有人说基于策略梯度的RL算法收敛快,而 阅读全文
摘要:
title: 强化学习问题中适当的增加反应时长可能会更有利于训练 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 强化学习问题中适当的增加反应时长可能会更有利于训练。 看到一个视频 I Trappe 阅读全文
2024年11月3日
摘要:
title: g++ error unrecognized command-line option ‘-std=c++23’; did you mean ‘-std=c++03’? description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或 阅读全文
摘要:
title: 强化学习算法——TPG算法(遗传编程GP算法)代码 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 tpg算法是一个使用模块涌现和复用机制的遗传编程(GP)算法,该算法在一些强化学习问 阅读全文
2024年11月2日
摘要:
title: 遗传算法+强化学习—TPG—Emergent Tangled Graph Representations for Atari Game Playing Agents_2 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔 阅读全文
2024年11月1日
摘要:
title: 遗传算法+强化学习—TPG—Emergent Tangled Graph Representations for Atari Game Playing Agents description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使 阅读全文