随笔分类 - 强化学习
摘要:第1章 简介 当我们思考学习的本质时,我们首先想到的是通过与环境交互来学习。 当一个婴儿玩耍,挥动手臂或环顾四周时,他没有明确的老师,但他确实通过直接的感觉与环境联系。 他可以通过这种联系获得大量关于因果关系、动作的结果以及如何实现目标的信息。 在我们的生活中,这种交互无疑是环境和自身知识的主要来源
阅读全文
摘要:1、强化学习介绍 强化学习是指智能体通过与环境进行交互,不断的通过试错,以获得更大的累计奖励为目的,得到更好的策略。强化学习的学习路线比较陡峭,因为涉及到的数学知识更多一些,需要概率论、随机过程的知识。这里通过我自己的一些学习经验以及看过的一些资料,整理了一条逐渐深入的学习路线,可以大幅度提高学习效
阅读全文
摘要:一、知识 二、代码 1、6个py文件 2、train.py import os os.environ['OMP_NUM_THREADS'] = '1' import argparse import torch from src.env import create_train_env from src
阅读全文
摘要:一、PPO连续 import torch import torch.nn as nn from torch.distributions import MultivariateNormal import gym import numpy as np device = torch.device("cud
阅读全文
摘要:一、PPO算法 二、PPO代码 import torch import torch.nn as nn from torch.distributions import Categorical import gymnasium as gym device = torch.device("cuda:0"
阅读全文
摘要:gymnasium是强化学习的库,比较难安装。 一、安装方法 安装Gymnasium(一定要all,这样可以安装所有依赖) pip install gymnasium[all]pip install gymnasium[all] 二、报错信息一:ERROR: Could not build whee
阅读全文