摘要: SmolVLA: 让机器人更懂 “看听说做” 的轻量化解决方案 https://www.cnblogs.com/huggingface/p/18912328 https://arxiv.org/abs/2506.01844 阅读全文
posted @ 2025-06-21 15:45 Angry_Panda 阅读(80) 评论(0) 推荐(0)

摘要: 相关: 面向分布式强化学习的经验回放框架(使用例子Demo)——Reverb: A Framework for Experience Replay 阅读全文
posted @ 2025-03-01 19:40 Angry_Panda 阅读(88) 评论(0) 推荐(0)

摘要: https://sites.google.com/view/humanoid-gym/ 阅读全文
posted @ 2024-05-07 11:26 Angry_Panda 阅读(397) 评论(0) 推荐(0)
摘要: https://research.nvidia.com/labs/gear/ 阅读全文
posted @ 2024-05-07 11:22 Angry_Panda 阅读(167) 评论(0) 推荐(0)
摘要: 打开下方网址,用上面发您的卡密登录,从入口进入搜索下载即可。 网址: https://www.xueshu789.cc/ 卡号:805974162 密码:824790 【注意事项】 首次使用请阅读下图说明,以免操作错误无法进入。 拍下24小时内帮小店五字以上美言,联系客服再送您查重软件。感谢您的支持 阅读全文
posted @ 2024-05-07 07:55 Angry_Panda 阅读(105) 评论(0) 推荐(0)

摘要: 论文: LEARNING VISION-GUIDED QUADRUPEDAL LOCOMOTION END-TO-END WITH CROSS-MODAL TRANSFORMERS 发表于ICLR2022 相关: https://zhuanlan.zhihu.com/p/581786377 阅读全文
posted @ 2024-05-06 18:44 Angry_Panda 阅读(275) 评论(0) 推荐(0)
摘要: 论文地址: https://arxiv.org/abs/2010.11929 Github地址: https://github.com/google-research/vision_transformer 阅读全文
posted @ 2024-05-06 18:03 Angry_Panda 阅读(75) 评论(0) 推荐(0)
摘要: 项目地址: https://openai.com/index/clip Github代码地址: https://github.com/openai/CLIP 阅读全文
posted @ 2024-05-06 17:16 Angry_Panda 阅读(128) 评论(0) 推荐(0)
摘要: https://www.understandingai.org/p/large-language-models-explained-with https://arxiv.org/abs/1905.05950 https://arxiv.org/abs/2012.14913 https://arxiv 阅读全文
posted @ 2024-05-06 14:11 Angry_Panda 阅读(185) 评论(0) 推荐(0)
摘要: GitHub地址: https://github.com/mit-han-lab/efficientvit#usage 相关: https://www.jetson-ai-lab.com/vit/tutorial_efficientvit.html 阅读全文
posted @ 2024-05-06 10:38 Angry_Panda 阅读(82) 评论(0) 推荐(0)

摘要: 项目地址: https://mobile-aloha.github.io/ 演示视频地址: https://www.youtube.com/watch?v=HaaZ8ss-HP4 论文地址: https://mobile-aloha.github.io/resources/mobile-aloha. 阅读全文
posted @ 2024-05-04 15:25 Angry_Panda 阅读(154) 评论(0) 推荐(0)
摘要: 地址: https://lucho1.github.io/JumpPointSearch/ 原作者还开发了A* 算法的Windows系统上的小程序:(重点:小程序意义不大,这个综述还是不赖的) 项目地址:https://github.com/lucho1/JumpPointSearch 重点: 这个 阅读全文
posted @ 2024-05-04 12:49 Angry_Panda 阅读(157) 评论(0) 推荐(0)
摘要: 地址: http://mapf.info/index.php/Main/Publications 与其对应的实验室地址: https://www.movingai.com/ 阅读全文
posted @ 2024-05-04 07:40 Angry_Panda 阅读(287) 评论(0) 推荐(0)

摘要: 视频地址: 周志华团队与Intel团队的讲座视频——强化学习的局限性与未来展望 视频链接地址: https://bizwebcast.smarket.com.cn/b975d6d9969a42cba9626adb7669676b/2a1fc2d76a65403cb76f99acd5b025da-8a 阅读全文
posted @ 2023-12-22 12:56 Angry_Panda 阅读(186) 评论(0) 推荐(0)

摘要: 作为reinforcement learning的一个入门学习的项目,spinningup的地址: (英文原版:) https://spinningup.openai.com/en/latest/index.html (中文翻译版:) https://spinningup.readthedocs.i 阅读全文
posted @ 2023-04-18 09:07 Angry_Panda 阅读(77) 评论(0) 推荐(0)

摘要: 相关: 【转载】 推荐算法之Thompson(汤普森)采样 【转载】 推荐系统 EE 问题与 Bandit 算法 python语言绘图:绘制一组beta分布图 转载: beta分布介绍 python语言绘图:绘制一组以beta分布为先验,以二项分布为似然的贝叶斯后验分布图 深入理解什么是Beta分布 阅读全文
posted @ 2023-01-01 13:13 Angry_Panda 阅读(2524) 评论(0) 推荐(0)
摘要: 源代码地址: https://github.com/tensorflow/agents TensorFlow给出的官方文档说明: https://tensorflow.google.cn/agents 相关视频: https://www.youtube.com/watch?v=U7g7-Jzj9qo 阅读全文
posted @ 2023-01-01 13:12 Angry_Panda 阅读(392) 评论(0) 推荐(0)

摘要: 深度学习这个概念已经火了好些年了,前些年刚开始的时候大家都不清除那些深度学习的框架是什么原理,in other words,大家都是只知道用这些深度学习框架,但是没有几个人真的了解这个框架的原理是什么,不过随着这几年开源的相关资料越来越多,慢慢的这也不是当年的什么高深秘密了,当年所有的深度学习框架都 阅读全文
posted @ 2022-11-17 19:29 Angry_Panda 阅读(900) 评论(0) 推荐(0)

2026年4月3日

摘要: conda install cuda-nvcc==12.1.105 阅读全文
posted @ 2026-04-03 14:07 Angry_Panda 阅读(2) 评论(0) 推荐(0)
摘要: 报错信息: '(MaxRetryError('HTTPSConnectionPool(host='huggingface.co', port=443): Max retries exceeded with url: /datasets/Jiayi-Pan/Countdown-Tasks-3to4/r 阅读全文
posted @ 2026-04-03 09:32 Angry_Panda 阅读(1) 评论(0) 推荐(0)

2026年4月2日

摘要: 对于一些性能要求较低的代码,高性能显卡的速度与低配置显卡的运行速度是没有差别的,甚至可能还不如,下面给出一个简单的图片识别的代码的pytorch运行性能对比图: A100 高配置显卡的运算时间: RTX 2060 SUPER 低配置显卡的运算时间: pytorch代码: import time im 阅读全文
posted @ 2026-04-02 20:26 Angry_Panda 阅读(1) 评论(0) 推荐(0)
摘要: 问题: 华为的晟腾环境和mindspore适合学术研究使用吗?非商用环境下是否建议入手? —— 如何正确的开启国产化替代 答案: 不建议。 原因: 这东西就是商用环境下使用的,说白了就是做国产化替代的,这东西其实就是个商业环境下使用的深度学习框架和编程环境,对于学术和初学者极为不友好。 另一个问题, 阅读全文
posted @ 2026-04-02 17:07 Angry_Panda 阅读(1) 评论(0) 推荐(0)
摘要: 地址: https://www.hiascend.com/hardware/ai-server 阅读全文
posted @ 2026-04-02 12:50 Angry_Panda 阅读(4) 评论(0) 推荐(0)
摘要: 强化学习工程师 【岗位职责】 研发适用于多自由度机器人(如双足、四足、轮足机器人等)的深度强化学习算法; 设计并实现智能体在复杂环境中稳定运动、平衡控制和避障等任务的策略; 搭建并维护机器人强化学习仿真训练平台,推动算法从仿真到真实物理机器人(Sim2Real)的有效迁移; 负责深度强化学习算法的复 阅读全文
posted @ 2026-04-02 12:10 Angry_Panda 阅读(1) 评论(0) 推荐(0)

2026年3月31日

摘要: ![45d94d069d57bf1e98960b32330493bd](https://img2024.cnblogs.com/blog/1088037/202603/1088037-20260331120012107-415592474.png) ![image](https://img2024.cnblogs.com/blog/1088037/202603/1088037-2026033112 阅读全文
posted @ 2026-03-31 12:00 Angry_Panda 阅读(4) 评论(0) 推荐(0)

2026年3月26日

摘要: 最终一句话总结 TRPO TRPO 是一种通过约束新旧策略距离,严格保证策略性能单调提升的理论完美的强化学习策略优化算法。 阅读全文
posted @ 2026-03-26 12:11 Angry_Panda 阅读(7) 评论(0) 推荐(0)

2026年3月25日

摘要: 相关: 自然梯度Natural Policy 阅读全文
posted @ 2026-03-25 17:58 Angry_Panda 阅读(4) 评论(0) 推荐(0)
摘要: 资料: 自然梯度Natural Policy 具体内容见原文: https://zhuanlan.zhihu.com/p/106984936 阅读全文
posted @ 2026-03-25 14:45 Angry_Panda 阅读(2) 评论(0) 推荐(0)

导航