随笔分类 - 4_强化学习
摘要:【强化学习玩转超级马里奥】05-最最简单的超级马里奥训练过程 最最简单的超级马里奥训练过程 from nes_py.wrappers import JoypadSpace import gym_super_mario_bros from gym_super_mario_bros.actions im
阅读全文
摘要:【强化学习玩转超级马里奥】04-stable-baselines3 库介绍 stable-baselines3库介绍 github:https://github.com/DLR-RM/stable-baselines3 doc:https://stable-baselines3.readthedoc
阅读全文
摘要:【强化学习玩转超级马里奥】03-马里奥环境代码说明 一、代码分析 from nes_py.wrappers import JoypadSpace import gym_super_mario_bros from gym_super_mario_bros.actions import SIMPLE_M
阅读全文
摘要:【强化学习玩转超级马里奥】02-运行超级马里奥 运行超级马里奥 from nes_py.wrappers import JoypadSpace import gym_super_mario_bros from gym_super_mario_bros.actions import SIMPLE_MO
阅读全文
摘要:【强化学习玩转超级马里奥】01-nes-py 包安装实例 一、要先安装 visual studio error: Microsoft Visual C++ 14.0 or greater is required. Get it with "Microsoft C++ Build Tools": ht
阅读全文
摘要:【强化学习玩转超级马里奥】01-超级马里奥环境安装 一、环境安装 1、安装超级马里奥环境 https://pypi.org/project/gym-super-mario-bros/ pip install gym-super-mario-bros 2、安装 python 版本的 nes 模拟器 h
阅读全文
摘要:00_强化学习玩马里奥课程介绍 一、课程内容 二、课程特点 1、会告诉大家怎么查看资料(教大家自学的能力) 2、一句句的带着大家敲代码 尽我我能,让大家快速学会 课程视频位置 强化学习玩超级马里奥【2022 年 3 月最新】(学不会可以来打我)_哔哩哔哩_bilibili https://www.b
阅读全文
摘要:蒙特卡洛树简单介绍 一、总结 一句话总结: 2006年,Remi Coulom开发了一款叫做【Crazy Stone的围棋游戏】,该款游戏表现令人惊讶,斩获了好几个锦标赛冠军。【蒙特卡洛树就是该游戏的一个核心算法】。 从全局来看,蒙特卡洛树搜索的主要目标是:【给定一个游戏状态来选择最佳的下一步】。
阅读全文
摘要:AlphaGo原理浅析 一、总结 一句话总结: 正如人类下棋那般【“手下一步棋,心想三步棋”】,Alphago也正是这个思想 【当处于一个状态时,机器会暗地里进行多次的尝试/采样】,并基于反馈回来的结果信息改进估值函数,从而最终通过增强版的估值函数来选择最优的落子动作。 1、AlphaGo的三大核心
阅读全文