lvdongjie-avatarx

2024年4月3日

摘要： CartPole V1包括一辆载着杆子在轨道上移动的推车。这是一个具有离散动作空间的简单环境。以下是 CartPole- 有用字段的详细信息： state：车的位置、车的速度、杆的角度、杆尖的速度； action：只能是以下之一，表示向左移动、不移动和向右移动；[0, 1, 2] reward：你阅读全文

posted @ 2024-04-03 17:33 lvdongjie-avatarx 阅读(156) 评论(0) 推荐(0) 编辑

适用于连续动作空间的强化学习算法-Actor-Critic算法族

摘要：适用于连续动作空间的强化学习算法通常被称为Actor-Critic算法。以下是一些主要的适用于连续动作空间的强化学习算法： Deep Deterministic Policy Gradient (DDPG): DDPG是一种基于Actor-Critic框架的算法，它结合了确定性策略梯度（Determ 阅读全文

posted @ 2024-04-03 17:26 lvdongjie-avatarx 阅读(309) 评论(0) 推荐(0) 编辑

适用于离散动作空间的强化学习算法

摘要：适用于离散动作空间的强化学习算法有很多，以下是其中一些主要的算法： Q-Learning: 是经典的离散动作空间强化学习算法之一，它通过迭代地更新动作值函数（Q函数）来学习最优策略。Q-Learning通常使用ε-greedy策略进行动作选择。 Deep Q-Network (DQN): DQN是一阅读全文

posted @ 2024-04-03 17:23 lvdongjie-avatarx 阅读(419) 评论(0) 推荐(0) 编辑

TianShou V1.0.0 在 Win10 安装过程

摘要： nvidia 4060 cuda 11.7 python 3.11 pip install poetrygit clone git@github.com:thu-ml/tianshou.git@v1.0.0cd tianshoupoetry installpip install opencv-pyt 阅读全文

posted @ 2024-04-03 17:05 lvdongjie-avatarx 阅读(28) 评论(0) 推荐(0) 编辑

RL 各平台比较

摘要： High Software Engineering Standards RL PlatformDocumentationCode CoverageType HintsLast Update Baselines ❌ ❌ ❌ Stable-Baselines ❌ Stable-Baselines3 ✔️ 阅读全文

posted @ 2024-04-03 10:42 lvdongjie-avatarx 阅读(22) 评论(0) 推荐(0) 编辑

2024年3月12日

空间变换j矩阵各元素的含义 4x4矩阵

摘要： 4x4矩阵在空间变换中常用于表示仿射变换。其中各个元素代表不同的几何意义，具体如下：第一行前三个元素表示变换后的X轴方向第二行前三个元素表示变换后的Y轴方向第三行前三个元素表示变换后的Z轴方向第四行前三个元素表示平移向量最后一列（第四列）通常是[0 0 0 1]，用于保持矩阵乘法的正确性。阅读全文

posted @ 2024-03-12 17:11 lvdongjie-avatarx 阅读(157) 评论(0) 推荐(0) 编辑

简单的 ping 测试

摘要：以下命令将模拟网络负载，相当于机器人由 FCI 控制的场景： sudo ping <fci-ip> -i 0.001 -D -c 10000 -s 1200 示例输出： PING <fci-ip> 1200(1228) bytes of data. [1500982522.977579] 1208 阅读全文

posted @ 2024-03-12 13:49 lvdongjie-avatarx 阅读(18) 评论(0) 推荐(0) 编辑

2022年8月10日

AI辅助分割-3DSlicer（自动建模）

摘要： 3DSlicer官方宣布，Nvidia AI辅助的分段扩展已经可以在最新的Slicer预览版（rev28686或更高版本）中使用。该扩展由Nvidia开发，并由Slicer核心开发人员提供。虽然Slicer中还有其他AI辅助分割模块（例如DeepInfer ，TOMAAT ，SlicerCIP ）阅读全文

posted @ 2022-08-10 16:42 lvdongjie-avatarx 阅读(2586) 评论(2) 推荐(0) 编辑

3DSlicer医学图像分割-在3DSlicer中使用英伟达的AI辅助工具 AIAA NvidiaAIAssistedAnnotation自动切割医学图像教程

摘要：前期准备下载3DSlicer并安装： 3DSlicer官网（http://www.slicer.org）或者直接下载（https://download.slicer.org），需要注意目前该插件只支持最新的3DSlicer Preview版本（4.11.x）官网下载速度慢，直接百度网盘：链接：阅读全文

posted @ 2022-08-10 16:32 lvdongjie-avatarx 阅读(1764) 评论(0) 推荐(0) 编辑

2022年5月21日

强化学习 (Reinforcement Learning)

摘要：详细内容简介根据维基百科对强化学习的定义：Reinforcement learning (RL) is an area of machine learning inspired by behaviorist psychology, concerned with how software agen 阅读全文

posted @ 2022-05-21 19:28 lvdongjie-avatarx 阅读(962) 评论(0) 推荐(0) 编辑

此博客专攻人工智能。

公告