随笔分类 -  强化学习

摘要:第1章 简介 当我们思考学习的本质时,我们首先想到的是通过与环境交互来学习。 当一个婴儿玩耍,挥动手臂或环顾四周时,他没有明确的老师,但他确实通过直接的感觉与环境联系。 他可以通过这种联系获得大量关于因果关系、动作的结果以及如何实现目标的信息。 在我们的生活中,这种交互无疑是环境和自身知识的主要来源 阅读全文
posted @ 2024-07-04 21:12 jasonzhangxianrong 阅读(109) 评论(0) 推荐(0) 编辑
摘要:1、强化学习介绍 强化学习是指智能体通过与环境进行交互,不断的通过试错,以获得更大的累计奖励为目的,得到更好的策略。强化学习的学习路线比较陡峭,因为涉及到的数学知识更多一些,需要概率论、随机过程的知识。这里通过我自己的一些学习经验以及看过的一些资料,整理了一条逐渐深入的学习路线,可以大幅度提高学习效 阅读全文
posted @ 2024-03-04 16:24 jasonzhangxianrong 阅读(338) 评论(0) 推荐(0) 编辑
摘要:一、知识 二、代码 1、6个py文件 2、train.py import os os.environ['OMP_NUM_THREADS'] = '1' import argparse import torch from src.env import create_train_env from src 阅读全文
posted @ 2024-02-29 19:15 jasonzhangxianrong 阅读(134) 评论(0) 推荐(0) 编辑
摘要:一、PPO连续 import torch import torch.nn as nn from torch.distributions import MultivariateNormal import gym import numpy as np device = torch.device("cud 阅读全文
posted @ 2024-02-29 15:07 jasonzhangxianrong 阅读(217) 评论(0) 推荐(0) 编辑
摘要:一、PPO算法 二、PPO代码 import torch import torch.nn as nn from torch.distributions import Categorical import gymnasium as gym device = torch.device("cuda:0" 阅读全文
posted @ 2024-02-29 15:04 jasonzhangxianrong 阅读(418) 评论(0) 推荐(0) 编辑
摘要:gymnasium是强化学习的库,比较难安装。 一、安装方法 安装Gymnasium(一定要all,这样可以安装所有依赖) pip install gymnasium[all]pip install gymnasium[all] 二、报错信息一:ERROR: Could not build whee 阅读全文
posted @ 2024-02-29 12:34 jasonzhangxianrong 阅读(470) 评论(0) 推荐(0) 编辑