Angry_Panda - 博客园

[置顶] SmolVLA: 让机器人更懂 “看听说做” 的轻量化解决方案

摘要： SmolVLA: 让机器人更懂 “看听说做” 的轻量化解决方案 https://www.cnblogs.com/huggingface/p/18912328 https://arxiv.org/abs/2506.01844 阅读全文

posted @ 2025-06-21 15:45 Angry_Panda 阅读(80) 评论(0) 推荐(0)

[置顶] 代码实践：面向分布式强化学习的经验回放框架（使用例子Demo）——Reverb: A Framework for Experience Replay

摘要：相关：面向分布式强化学习的经验回放框架（使用例子Demo）——Reverb: A Framework for Experience Replay 阅读全文

posted @ 2025-03-01 19:40 Angry_Panda 阅读(88) 评论(0) 推荐(0)

[置顶] 人形机器人开源项目

摘要： https://sites.google.com/view/humanoid-gym/ 阅读全文

posted @ 2024-05-07 11:26 Angry_Panda 阅读(397) 评论(0) 推荐(0)

[置顶] NVIDIA官方的具身机器人实验室Gear

摘要： https://research.nvidia.com/labs/gear/ 阅读全文

posted @ 2024-05-07 11:22 Angry_Panda 阅读(167) 评论(0) 推荐(0)

[置顶] Reinforcement 代码库 & 淘宝买的知网账号

摘要：打开下方网址，用上面发您的卡密登录，从入口进入搜索下载即可。网址： https://www.xueshu789.cc/ 卡号：805974162 密码：824790 【注意事项】首次使用请阅读下图说明，以免操作错误无法进入。拍下24小时内帮小店五字以上美言，联系客服再送您查重软件。感谢您的支持阅读全文

posted @ 2024-05-07 07:55 Angry_Panda 阅读(105) 评论(0) 推荐(0)

[置顶] 使用Transformer模型实现四足机器人控制—— 跨模态Transformer: LocoTransformer —— LEARNING VISION-GUIDED QUADRUPEDAL LOCOMOTION END-TO-END WITH CROSS-MODAL TRANSFORMERS

摘要：论文： LEARNING VISION-GUIDED QUADRUPEDAL LOCOMOTION END-TO-END WITH CROSS-MODAL TRANSFORMERS 发表于ICLR2022 相关： https://zhuanlan.zhihu.com/p/581786377 阅读全文

posted @ 2024-05-06 18:44 Angry_Panda 阅读(275) 评论(0) 推荐(0)

[置顶] ViT：拉开Trasnformer在图像领域正式挑战CNN的序幕 | ICLR 2021 —— An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

摘要：论文地址： https://arxiv.org/abs/2010.11929 Github地址： https://github.com/google-research/vision_transformer 阅读全文

posted @ 2024-05-06 18:03 Angry_Panda 阅读(75) 评论(0) 推荐(0)

[置顶] OpenAI —— CLIP: Connecting text and images

摘要：项目地址： https://openai.com/index/clip Github代码地址： https://github.com/openai/CLIP 阅读全文

posted @ 2024-05-06 17:16 Angry_Panda 阅读(128) 评论(0) 推荐(0)

摘要： https://www.understandingai.org/p/large-language-models-explained-with https://arxiv.org/abs/1905.05950 https://arxiv.org/abs/2012.14913 https://arxiv 阅读全文

posted @ 2024-05-06 14:11 Angry_Panda 阅读(185) 评论(0) 推荐(0)

[置顶] Efficientvit: Enhanced linear attention for high-resolution low-computation visual recognition

摘要： GitHub地址： https://github.com/mit-han-lab/efficientvit#usage 相关： https://www.jetson-ai-lab.com/vit/tutorial_efficientvit.html 阅读全文

posted @ 2024-05-06 10:38 Angry_Panda 阅读(82) 评论(0) 推荐(0)

[置顶] 家务机器人（人形机器人）—— Mobile ALOHA: Your Housekeeping Robot

摘要：项目地址： https://mobile-aloha.github.io/ 演示视频地址： https://www.youtube.com/watch?v=HaaZ8ss-HP4 论文地址： https://mobile-aloha.github.io/resources/mobile-aloha. 阅读全文

posted @ 2024-05-04 15:25 Angry_Panda 阅读(154) 评论(0) 推荐(0)

[置顶] 路径规划综述博客：A* Optimizations and Improvements

摘要：地址： https://lucho1.github.io/JumpPointSearch/ 原作者还开发了A* 算法的Windows系统上的小程序：（重点：小程序意义不大，这个综述还是不赖的）项目地址：https://github.com/lucho1/JumpPointSearch 重点：这个阅读全文

posted @ 2024-05-04 12:49 Angry_Panda 阅读(157) 评论(0) 推荐(0)

[置顶] 多智能体路径规划问题 —— Learn all about Multi-Agent Path Finding (MAPF)

摘要：地址： http://mapf.info/index.php/Main/Publications 与其对应的实验室地址： https://www.movingai.com/ 阅读全文

posted @ 2024-05-04 07:40 Angry_Panda 阅读(287) 评论(0) 推荐(0)

[置顶] AI实践者师生夏令营讲座视频：南京大学Lamda实验室（周志华团队）讲座视频 —— 强化学习的局限性与展望

摘要：视频地址：周志华团队与Intel团队的讲座视频——强化学习的局限性与未来展望视频链接地址： https://bizwebcast.smarket.com.cn/b975d6d9969a42cba9626adb7669676b/2a1fc2d76a65403cb76f99acd5b025da-8a 阅读全文

posted @ 2023-12-22 12:56 Angry_Panda 阅读(186) 评论(0) 推荐(0)

[置顶] 关于spinninup的学习笔记

摘要：作为reinforcement learning的一个入门学习的项目，spinningup的地址：（英文原版：） https://spinningup.openai.com/en/latest/index.html （中文翻译版：） https://spinningup.readthedocs.i 阅读全文

posted @ 2023-04-18 09:07 Angry_Panda 阅读(77) 评论(0) 推荐(0)

[置顶] 再谈汤普森采样（Thompson Sampling）

摘要：相关：【转载】推荐算法之Thompson(汤普森)采样【转载】推荐系统 EE 问题与 Bandit 算法 python语言绘图：绘制一组beta分布图转载： beta分布介绍 python语言绘图：绘制一组以beta分布为先验，以二项分布为似然的贝叶斯后验分布图深入理解什么是Beta分布阅读全文

posted @ 2023-01-01 13:13 Angry_Panda 阅读(2524) 评论(0) 推荐(0)

[置顶] tensorflow的官方强化学习库agents的相关内容及一些注意事项

摘要：源代码地址： https://github.com/tensorflow/agents TensorFlow给出的官方文档说明： https://tensorflow.google.cn/agents 相关视频： https://www.youtube.com/watch?v=U7g7-Jzj9qo 阅读全文

posted @ 2023-01-01 13:12 Angry_Panda 阅读(392) 评论(0) 推荐(0)

[置顶] 深度学习框架中的“自动求导”原理是什么？

摘要：深度学习这个概念已经火了好些年了，前些年刚开始的时候大家都不清除那些深度学习的框架是什么原理，in other words，大家都是只知道用这些深度学习框架，但是没有几个人真的了解这个框架的原理是什么，不过随着这几年开源的相关资料越来越多，慢慢的这也不是当年的什么高深秘密了，当年所有的深度学习框架都阅读全文

posted @ 2022-11-17 19:29 Angry_Panda 阅读(900) 评论(0) 推荐(0)

使用conda安装配置cuda的编译环境 —— conda安装nvcc

摘要： conda install cuda-nvcc==12.1.105 阅读全文

posted @ 2026-04-03 14:07 Angry_Panda 阅读(2) 评论(0) 推荐(0)

huggingface下载数据集报错：如何解决huggingface的网络问题 —— 代理

摘要：报错信息： '(MaxRetryError('HTTPSConnectionPool(host='huggingface.co', port=443): Max retries exceeded with url: /datasets/Jiayi-Pan/Countdown-Tasks-3to4/r 阅读全文

posted @ 2026-04-03 09:32 Angry_Panda 阅读(1) 评论(0) 推荐(0)

深度学习：低配显卡和高配显卡的算法性能对比 —— rtx2060 super和A100 —— 低配显卡一定比高配显卡运行速度慢吗

摘要：对于一些性能要求较低的代码，高性能显卡的速度与低配置显卡的运行速度是没有差别的，甚至可能还不如，下面给出一个简单的图片识别的代码的pytorch运行性能对比图： A100 高配置显卡的运算时间： RTX 2060 SUPER 低配置显卡的运算时间： pytorch代码： import time im 阅读全文

posted @ 2026-04-02 20:26 Angry_Panda 阅读(1) 评论(0) 推荐(0)

深度学习：华为的晟腾环境和mindspore适合学术研究使用吗？非商用环境下是否建议入手？ —— 如何正确的开启国产化替代

摘要：问题：华为的晟腾环境和mindspore适合学术研究使用吗？非商用环境下是否建议入手？ —— 如何正确的开启国产化替代答案：不建议。原因：这东西就是商用环境下使用的，说白了就是做国产化替代的，这东西其实就是个商业环境下使用的深度学习框架和编程环境，对于学术和初学者极为不友好。另一个问题，阅读全文

posted @ 2026-04-02 17:07 Angry_Panda 阅读(1) 评论(0) 推荐(0)

超节点服务器 —— 多个刀片式服务器如何组建成一个“单主机服务器”

摘要：地址： https://www.hiascend.com/hardware/ai-server 阅读全文

posted @ 2026-04-02 12:50 Angry_Panda 阅读(4) 评论(0) 推荐(0)

人形机器人 —— 强化学习岗位要求

摘要：强化学习工程师【岗位职责】研发适用于多自由度机器人（如双足、四足、轮足机器人等）的深度强化学习算法；设计并实现智能体在复杂环境中稳定运动、平衡控制和避障等任务的策略；搭建并维护机器人强化学习仿真训练平台，推动算法从仿真到真实物理机器人（Sim2Real）的有效迁移；负责深度强化学习算法的复阅读全文

posted @ 2026-04-02 12:10 Angry_Panda 阅读(1) 评论(0) 推荐(0)

人形机器人 ——傅里叶N1—— 控制界面——电机控制系数

摘要： ![45d94d069d57bf1e98960b32330493bd](https://img2024.cnblogs.com/blog/1088037/202603/1088037-20260331120012107-415592474.png) ![image](https://img2024.cnblogs.com/blog/1088037/202603/1088037-2026033112 阅读全文

posted @ 2026-03-31 12:00 Angry_Panda 阅读(4) 评论(0) 推荐(0)

豆包AI生成 —— 强化学习 —— TRPO算法

摘要：最终一句话总结 TRPO TRPO 是一种通过约束新旧策略距离，严格保证策略性能单调提升的理论完美的强化学习策略优化算法。阅读全文

posted @ 2026-03-26 12:11 Angry_Panda 阅读(7) 评论(0) 推荐(0)

豆包AI生成内容 —— 完整深度解析：概率流形、费雪信息矩阵与自然梯度（全维度覆盖）

摘要：相关：自然梯度Natural Policy 阅读全文

posted @ 2026-03-25 17:58 Angry_Panda 阅读(4) 评论(0) 推荐(0)

强化学习理论基础 —— 自然梯度Natural Policy

摘要：资料：自然梯度Natural Policy 具体内容见原文： https://zhuanlan.zhihu.com/p/106984936 阅读全文

posted @ 2026-03-25 14:45 Angry_Panda 阅读(2) 评论(0) 推荐(0)

Angry Panda（T-800）

公告

导航