摘要: 强化学习 Reinforcement Learning 强化学习是一种机器学习思想,其关心一个智能体如何采取行动以达到最大化激励回报。 基本的强化学习模型以马尔可夫决策过程建模。 马尔可夫决策过程 Markov Decision Process 系统要素 A 行动空间; S状态空间; $P^a_{s 阅读全文
posted @ 2023-04-12 02:02 二球悬铃木 阅读(58) 评论(0) 推荐(0) 编辑
摘要: Graph Representation Learning (Graph Neural Networks, GNN) A Review of methods and applications, Zhou Jie 2020, on AI Open Figure. An overwiew of comp 阅读全文
posted @ 2022-07-06 23:48 二球悬铃木 阅读(167) 评论(0) 推荐(0) 编辑
摘要: 机器学习技术间的包含关系: 深度学习⊆表示学习(即特征学习)⊆机器学习⊆人工智能 相比于(传统)机器学习,可以认为深度学习自动学习到特征,而(传统)机器学习中特征则由人工进行设计和提取。 multi-class (多分类中的)多类别任务。一个样本的类别有且仅有多个类别中的一个。 multi-labe 阅读全文
posted @ 2022-07-06 23:48 二球悬铃木 阅读(156) 评论(0) 推荐(0) 编辑
摘要: 机器学习 (传统机器学习) (Machine Learning) 预测的是离散值,则学习任务称为“分类”(classification)任务;预测的是连续值,则是“回归”(regression)任务。 对于二分类任务,一类通常称为“正类”(正例,positive class/label),另一类称为 阅读全文
posted @ 2022-07-06 23:47 二球悬铃木 阅读(264) 评论(0) 推荐(0) 编辑
摘要: Sampling 采样 A* sampling CJ Maddison, 2014, NeurIPS A pratical generic sampling algorithm that searchs for the maximum of a Gumbel process using A* sea 阅读全文
posted @ 2022-07-06 23:44 二球悬铃木 阅读(105) 评论(0) 推荐(0) 编辑
摘要: Abstract Algebra 抽象代数 “代数”研究的不再只是“数”(实数或复数),而是更广泛的符号,包含“实数”、“复数”、“函数”、或其他,从一般意义上的“数”推广到符号。 $\sigma$ -algebra ( $\sigma$ -field) [Def] A collection $\S 阅读全文
posted @ 2022-07-06 23:43 二球悬铃木 阅读(373) 评论(0) 推荐(0) 编辑
摘要: 香侬信息论 Shannon Information Theory 自信息(self-information): $I(x)=-\log p(x)$ ,其中约定 $I(x)=0 \text{ if } p(x)=0$ ,以自然常数为底的对数时,信息单位为奈特(nats),以2为底时单位为比特(bits 阅读全文
posted @ 2022-07-06 23:42 二球悬铃木 阅读(87) 评论(0) 推荐(0) 编辑
摘要: Finite State Automaton also called Finite State Machine, State Machine, 是一种计算数学模型,其根据输入时序信号将抽象机器从一种状态改变到另一种状态。 Deterministic Finite Automaton, DFA (au 阅读全文
posted @ 2022-07-06 23:42 二球悬铃木 阅读(54) 评论(0) 推荐(0) 编辑
摘要: Calculus 微积分 微积分包含微分(differentiation)和积分(integration),微分是基于变量增量无限细微化思想来分析解决问题的方法,积分是基于细微化增量无限汇聚思想来分析解决问题的方法。 在微分理论中,一个变量的无限小的增量 $\Delta x$ 被称为“微分”(Dif 阅读全文
posted @ 2022-07-06 23:41 二球悬铃木 阅读(400) 评论(0) 推荐(0) 编辑
摘要: 概率论与数理统计 Probability Theory and Statistics Sample space, Event, Event space 样本空间、事件、事件空间 [Def] The set of all possible outcomes is called the sample s 阅读全文
posted @ 2022-07-06 23:40 二球悬铃木 阅读(306) 评论(0) 推荐(0) 编辑