摘要:
第三章 马尔可夫决策过程 Reference: 动手学强化学习 目录第三章 马尔可夫决策过程3.1 随机过程3.1.1 基本概念3.1.2 马尔可夫过程马尔可夫性质马尔可夫过程一个简单的例子3.1.3 MDP:马尔可夫决策过程马尔可夫决策过程3.2 马尔可夫奖励过程3.2.1 回报3.2.2 价值函 阅读全文
摘要:
Chapter 2 MAB问题 参考:动手学强化学习,建议读者去看看原文 2.1 简介 智能体与环境交互学习,试错型学习。 多臂lh机(后简称MAB)问题,是一种简化的强化学习问题。 不存在状态信息,仅存在动作和奖励,是最简单的交互学习形式。 主要有探索和利用问题。 2.2 问题介绍 2.2.1 定 阅读全文
摘要:
Chapter 3 SQL介绍 参考书目:《数据库系统概念》第7版,机械工程出版社 Reference: Database System Concepts, 7th Edition 广泛的数据库查询语言。 定义数据结构,修改数据库中的数据,安全性约束。 目录Chapter 3 SQL介绍3.1 查询 阅读全文
摘要:
1 简介 1.1 简介 序贯决策(sequential decision making)。决策与预测任务不同,不同的决策会带来不同的后果。预测仅针对输入,并期望未来与预测一致。 1.2 什么是强化学习 机器与环境交互,实现目标。 在一个环境的一个状态下做出动作决策,并将这个动作作用到环境中。环境将发 阅读全文
摘要:
Chapter2 关系模型介绍 参考书目:《数据库系统概念》第7版,机械工程出版社 Reference: Database System Concepts, 7th Edition 主要的数据模型,简单独特。 目录Chapter2 关系模型介绍2.1 关系数据库的结构2.2 数据库模式2.3 码2. 阅读全文
摘要:
Chapter 1 Introduction 引言 参考书目:《数据库系统概念》第7版,机械工程出版社 Reference: Database System Concepts, 7th Edition 目录Chapter 1 Introduction 引言1.1 应用1.2 目标1.3 数据视图1. 阅读全文
摘要:
树 目录树基础介绍树的介绍二叉树刷题与解答865.具有所有最深节点的最小子树834.树中距离之和树上DP:换根DP优化1: 只需要保证不再访问父节点,作为树(无向无环图)可以不需要vis数组优化2: 采用lambda表达式和"deducing self"(C++23)方法1339.分裂二叉树的最大乘 阅读全文
摘要:
无题 为了备考,最近一直在刷leetcode。在做每日一题2080.区间内查询数字的频率的时候,使用哈希表和二分查找。于是慢悠悠地写完之后,交上去一发,发现: class RangeFreqQuery { private: unordered_map<int, vector<int> > dataW 阅读全文
摘要:
在mac上使用vscode+CMAKE+LLVM 配置C++环境 仅供参考,请多谅解 原先的vscode官方推荐插件intellisense实在是太慢,以至于在很多大型项目(ns3,OS)等进行静态检查的速度奇慢无比,并且大量消耗资源。于是尝试在mac上使用llvm+clangd进行配置。由于采用的 阅读全文
摘要:
Chapter 1: Introductions 参考书目:Compilers: Principles, Techniques, & Tools 目录Chapter 1: Introductions1.1 语言处理器(Language processors)Example 1.1: 字节码,混合编译 阅读全文