随笔分类 -  机器学习笔记

摘要:本笔记主体框架主要参考自姜罕老师所做的技术分享,本人对其中的一些具体技术细节做了资料搜集与补充。 参考材料: https://zhuanlan.zhihu.com/p/369635307 1. 概述 本节主要介绍搜索引擎的一些基本概念(如搜索引擎的分类、搜索好坏的衡量指标)以及搜索系统的基本架构 1 阅读全文
posted @ 2023-09-13 16:39 空口吃大蒜 阅读(361) 评论(0) 推荐(0)
摘要:1.逆强化学习与强化学习的联系 强化学习的基本模型是马尔可夫决策过程(Markov Decision Process,MDP),其可以使用五元组来表示: $(S,A,P,R,T/\gamma)$ ,分别代表状态空间、动作空间、状态转移概率、奖赏函数、迭代次数(折损因子)。实际上,在之前的学习中,我们 阅读全文
posted @ 2023-04-11 20:02 空口吃大蒜 阅读(1337) 评论(0) 推荐(0)
摘要:1.1. 简介 强化学习(reinforcement learning)是机器学习的一个重要分支,其具有两个重要的基本元素:状态和动作。类似于编译原理中的自动机,或数据结构中的AOE图,强化学习研究的就是怎样找到一种最好的路径,使得不同状态之间通过执行相应动作后转换,最终到达目标状态。先介绍几个名词 阅读全文
posted @ 2023-04-07 22:02 空口吃大蒜 阅读(303) 评论(3) 推荐(2)