动手学强化学习 第二章 多臂tiger机问题 阅读笔记
摘要:第二章 多臂tiger机问题 第一节 简介 强化学习是一种试错型学习范式。 第二节 问题介绍 多臂tiger机(multi-armed bandit,MAB)不存在状态信息,只有动作和奖励。有一个拥有K根拉杆的tiger机,拉动每一根拉杆都对应一个关于奖励的概率分布R。我们每次拉动其中一根拉杆,就可
阅读全文
posted @
2023-02-25 09:25
小染子
阅读(205)
推荐(0)
C++ primer 5th 第二章 变量和基本类型 阅读笔记
摘要:第二章 变量和基本类型 第一节 基本内置类型 C++标准规定了算术类型尺寸的最小值,同时允许编译器赋予这些类型更大的尺寸。 比如: | 类型 | 含义 | 最小尺寸 | | | | | | bool | 布尔类型 | 未定义 | | wchar_t | 宽字符 | 16位 | | char16_t
阅读全文
posted @
2023-02-23 23:39
小染子
阅读(104)
推荐(0)
动手学强化学习 第一章 初探强化学习 阅读笔记
摘要:强化学习是实现序贯决策的机器学习方法。 预测仅仅产生一个针对输入数据的信号,并期望它和未来可观测到的信号一致。 强化学习是指机器通过与环境交互来实现目标的一种计算方法。机器和环境的一轮交互是指,机器在环境的一个状态下做一个动作决策,把这个动作作用到环境当中,这个环境发生相应的改变并且将奖励反馈和下一
阅读全文
posted @
2023-02-23 09:48
小染子
阅读(317)
推荐(0)
C++ primer 5th 第一章 开始 阅读笔记
摘要:第一章 开始 第一节 编写一个简单的C++程序 不同编译器使用不同的后缀命名约定,比如cc、cpp、c。 比如main程序保存到prog1.cc中,可以使用如下命令来编译它:cc prog1.cc。其中,cc是编译器程序的名字,编译器生成一个可执行文件,Windows系统命名为prog1.exe,U
阅读全文
posted @
2023-02-20 10:34
小染子
阅读(48)
推荐(0)