机器学习笔记 - 随笔分类 - 空口吃大蒜

搜索算法笔记

摘要：本笔记主体框架主要参考自姜罕老师所做的技术分享，本人对其中的一些具体技术细节做了资料搜集与补充。参考材料： https://zhuanlan.zhihu.com/p/369635307 1. 概述本节主要介绍搜索引擎的一些基本概念（如搜索引擎的分类、搜索好坏的衡量指标）以及搜索系统的基本架构 1 阅读全文

posted @ 2023-09-13 16:39 空口吃大蒜阅读(361) 评论(0) 推荐(0)

逆强化学习笔记

摘要：1.逆强化学习与强化学习的联系强化学习的基本模型是马尔可夫决策过程（Markov Decision Process,MDP），其可以使用五元组来表示： $(S,A,P,R,T/\gamma)$ ，分别代表状态空间、动作空间、状态转移概率、奖赏函数、迭代次数（折损因子）。实际上，在之前的学习中，我们阅读全文

posted @ 2023-04-11 20:02 空口吃大蒜阅读(1340) 评论(0) 推荐(0)

强化学习笔记

摘要：1.1. 简介强化学习（reinforcement learning）是机器学习的一个重要分支，其具有两个重要的基本元素：状态和动作。类似于编译原理中的自动机，或数据结构中的AOE图，强化学习研究的就是怎样找到一种最好的路径，使得不同状态之间通过执行相应动作后转换，最终到达目标状态。先介绍几个名词阅读全文

posted @ 2023-04-07 22:02 空口吃大蒜阅读(303) 评论(3) 推荐(2)

空口吃大蒜

随笔分类 - 机器学习笔记

公告