2024 年 2月 29 日随笔档案 - jasonzhangxianrong

2024年2月29日

摘要： 1.1 简介亲爱的读者，欢迎来到强化学习的世界。初探强化学习，你是否充满了好奇和期待呢？我们想说，首先感谢你的选择，学习本书不仅能够帮助你理解强化学习的算法原理，提高代码实践能力，更能让你了解自己是否喜欢决策智能这个方向，从而更好地决策未来是否从事人工智能方面的研究和实践工作。人生中充满选择，每次阅读全文

posted @ 2024-02-29 22:14 jasonzhangxianrong 阅读(184) 评论(0) 推荐(0) 编辑

强化学习（五）：A3C

摘要：一、知识二、代码 1、6个py文件 2、train.py import os os.environ['OMP_NUM_THREADS'] = '1' import argparse import torch from src.env import create_train_env from src 阅读全文

posted @ 2024-02-29 19:15 jasonzhangxianrong 阅读(84) 评论(0) 推荐(0) 编辑

强化学习（四）：PPO连续

摘要：一、PPO连续 import torch import torch.nn as nn from torch.distributions import MultivariateNormal import gym import numpy as np device = torch.device("cud 阅读全文

posted @ 2024-02-29 15:07 jasonzhangxianrong 阅读(151) 评论(0) 推荐(0) 编辑

强化学习（三）：PPO

摘要：一、PPO算法二、PPO代码 import torch import torch.nn as nn from torch.distributions import Categorical import gymnasium as gym device = torch.device("cuda:0" 阅读全文

posted @ 2024-02-29 15:04 jasonzhangxianrong 阅读(256) 评论(0) 推荐(0) 编辑

强化学习（二）：安装gym.

摘要： gymnasium是强化学习的库，比较难安装。一、安装方法安装Gymnasium（一定要all，这样可以安装所有依赖） pip install gymnasium[all]pip install gymnasium[all] 二、报错信息一：ERROR: Could not build whee 阅读全文

posted @ 2024-02-29 12:34 jasonzhangxianrong 阅读(325) 评论(0) 推荐(0) 编辑

公告