随笔档案「2023年2月」 - 小染子

动手学强化学习第二章多臂tiger机问题阅读笔记

摘要：第二章多臂tiger机问题第一节简介强化学习是一种试错型学习范式。第二节问题介绍多臂tiger机（multi-armed bandit，MAB）不存在状态信息，只有动作和奖励。有一个拥有K根拉杆的tiger机，拉动每一根拉杆都对应一个关于奖励的概率分布R。我们每次拉动其中一根拉杆，就可阅读全文

posted @ 2023-02-25 09:25 小染子阅读(205) 评论(0) 推荐(0)

C++ primer 5th 第二章变量和基本类型阅读笔记

摘要：第二章变量和基本类型第一节基本内置类型 C++标准规定了算术类型尺寸的最小值，同时允许编译器赋予这些类型更大的尺寸。比如： | 类型 | 含义 | 最小尺寸 | | | | | | bool | 布尔类型 | 未定义 | | wchar_t | 宽字符 | 16位 | | char16_t 阅读全文

posted @ 2023-02-23 23:39 小染子阅读(104) 评论(0) 推荐(0)

动手学强化学习第一章初探强化学习阅读笔记

摘要：强化学习是实现序贯决策的机器学习方法。预测仅仅产生一个针对输入数据的信号，并期望它和未来可观测到的信号一致。强化学习是指机器通过与环境交互来实现目标的一种计算方法。机器和环境的一轮交互是指，机器在环境的一个状态下做一个动作决策，把这个动作作用到环境当中，这个环境发生相应的改变并且将奖励反馈和下一阅读全文

posted @ 2023-02-23 09:48 小染子阅读(317) 评论(0) 推荐(0)

C++ primer 5th 第一章开始阅读笔记

摘要：第一章开始第一节编写一个简单的C++程序不同编译器使用不同的后缀命名约定，比如cc、cpp、c。比如main程序保存到prog1.cc中，可以使用如下命令来编译它：cc prog1.cc。其中，cc是编译器程序的名字，编译器生成一个可执行文件，Windows系统命名为prog1.exe，U 阅读全文

posted @ 2023-02-20 10:34 小染子阅读(48) 评论(0) 推荐(0)