上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 35 下一页
摘要: 第 4 章 动态规划算法 4.1 简介 动态规划(dynamic programming)是程序设计算法中非常重要的内容,能够高效解决一些经典问题,例如背包问题和最短路径规划。动态规划的基本思想是将待求解问题分解成若干个子问题,先求解子问题,然后从这些子问题的解得到目标问题的解。动态规划会保存已解决 阅读全文
posted @ 2024-03-03 14:52 jasonzhangxianrong 阅读(278) 评论(0) 推荐(0) 编辑
摘要: Typora是一款优秀的Markdown编辑器,它可以让你轻松编写出精美的文档。但是,Typora不再免费,必须付费才能继续使用。那么,是否有办法可以激活Typora呢?答案是肯定的。本文将为您介绍三种激活方法,让您可以继续使用Typora。 方法一:使用免费旧版本,修改注册表延长试用(操作难度较高 阅读全文
posted @ 2024-03-03 13:49 jasonzhangxianrong 阅读(362) 评论(0) 推荐(0) 编辑
摘要: 一、greedy import numpy as np import matplotlib.pyplot as plt class BernoulliBandit: """ 伯努利多臂老胡机,输入K表示拉杆个数 """ def __init__(self, K): self.probs = np.r 阅读全文
posted @ 2024-03-01 17:46 jasonzhangxianrong 阅读(75) 评论(0) 推荐(0) 编辑
摘要: 转载自:https://hrl.boyuai.com/chapter/1/马尔可夫决策过程 3.1 简介 马尔可夫决策过程(Markov decision process,MDP)是强化学习的重要概念。要学好强化学习,我们首先要掌握马尔可夫决策过程的基础知识。前两章所说的强化学习中的环境一般就是一个 阅读全文
posted @ 2024-03-01 17:32 jasonzhangxianrong 阅读(1033) 评论(0) 推荐(0) 编辑
摘要: 1.1 简介 亲爱的读者,欢迎来到强化学习的世界。初探强化学习,你是否充满了好奇和期待呢?我们想说,首先感谢你的选择,学习本书不仅能够帮助你理解强化学习的算法原理,提高代码实践能力,更能让你了解自己是否喜欢决策智能这个方向,从而更好地决策未来是否从事人工智能方面的研究和实践工作。人生中充满选择,每次 阅读全文
posted @ 2024-02-29 22:14 jasonzhangxianrong 阅读(184) 评论(0) 推荐(0) 编辑
摘要: 一、知识 二、代码 1、6个py文件 2、train.py import os os.environ['OMP_NUM_THREADS'] = '1' import argparse import torch from src.env import create_train_env from src 阅读全文
posted @ 2024-02-29 19:15 jasonzhangxianrong 阅读(84) 评论(0) 推荐(0) 编辑
摘要: 一、PPO连续 import torch import torch.nn as nn from torch.distributions import MultivariateNormal import gym import numpy as np device = torch.device("cud 阅读全文
posted @ 2024-02-29 15:07 jasonzhangxianrong 阅读(151) 评论(0) 推荐(0) 编辑
摘要: 一、PPO算法 二、PPO代码 import torch import torch.nn as nn from torch.distributions import Categorical import gymnasium as gym device = torch.device("cuda:0" 阅读全文
posted @ 2024-02-29 15:04 jasonzhangxianrong 阅读(256) 评论(0) 推荐(0) 编辑
摘要: gymnasium是强化学习的库,比较难安装。 一、安装方法 安装Gymnasium(一定要all,这样可以安装所有依赖) pip install gymnasium[all]pip install gymnasium[all] 二、报错信息一:ERROR: Could not build whee 阅读全文
posted @ 2024-02-29 12:34 jasonzhangxianrong 阅读(325) 评论(0) 推荐(0) 编辑
摘要: 一、打包 conda pack -n python-37-zxr --ignore-editable-packages --dest-prefix /opt/conda/envs/python-37-zxr 二、进入沙箱 singularity shell --writable pt37 mkdir 阅读全文
posted @ 2023-12-08 12:39 jasonzhangxianrong 阅读(99) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 35 下一页