随笔分类 - 机器学习笔记
搜索算法笔记
摘要:本笔记主体框架主要参考自姜罕老师所做的技术分享,本人对其中的一些具体技术细节做了资料搜集与补充。 参考材料: https://zhuanlan.zhihu.com/p/369635307 1. 概述 本节主要介绍搜索引擎的一些基本概念(如搜索引擎的分类、搜索好坏的衡量指标)以及搜索系统的基本架构 1
逆强化学习笔记
摘要:1.逆强化学习与强化学习的联系 强化学习的基本模型是马尔可夫决策过程(Markov Decision Process,MDP),其可以使用五元组来表示: ,分别代表状态空间、动作空间、状态转移概率、奖赏函数、迭代次数(折损因子)。实际上,在之前的学习中,我们
强化学习笔记
摘要:1.1. 简介 强化学习(reinforcement learning)是机器学习的一个重要分支,其具有两个重要的基本元素:状态和动作。类似于编译原理中的自动机,或数据结构中的AOE图,强化学习研究的就是怎样找到一种最好的路径,使得不同状态之间通过执行相应动作后转换,最终到达目标状态。先介绍几个名词