2021年3月31日

K近邻算法(KNN)

摘要: 1. 什么是KNN 1.1 KNN的通俗解释 何谓K近邻算法,即K-Nearest Neighbor algorithm,简称KNN算法,单从名字来猜想,可以简单粗暴的认为是:K个最近的邻居,当K=1时,算法便成了最近邻算法,即寻找最近的那个邻居。 用官方的话来说,所谓K近邻算法,即是给定一个训练数 阅读全文

posted @ 2021-03-31 13:35 农夫三拳有點疼 阅读(1142) 评论(0) 推荐(0) 编辑

机器学习特征工程和优化方法

摘要: 1. 特征工程有哪些? 特征工程,顾名思义,是对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。从本质上来讲,特征工程是一个表示和展现数 据的过程。在实际工作中,特征工程旨在去除原始数据中的杂质和冗余,设计更高效的特征以刻画求解的问题与预测模型之间的关系。 主要讨论以下两种常用 阅读全文

posted @ 2021-03-31 13:26 农夫三拳有點疼 阅读(354) 评论(0) 推荐(0) 编辑

聚类(Clustering)

摘要: 1. 聚类算法都是无监督学习吗? 什么是聚类算法?聚类是一种机器学习技术,它涉及到数据点的分组。给定一组数据点,我们可以使用聚类算法将每个数据点划分为一个特定的组。理论上,同一组中的数据点应该具有相似的属性和/或特征,而不同组中的数据点应该具有高度不同的属性和/或特征。聚类是一种无监督学习的方法,是 阅读全文

posted @ 2021-03-31 11:28 农夫三拳有點疼 阅读(857) 评论(0) 推荐(0) 编辑

最大期望算法(EM)

摘要: 1. 什么是EM算法 最大期望算法(Expectation-maximization algorithm,又译为期望最大化算法),是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐性变量。 最大期望算法经过两个步骤交替进行计算, 第一步是计算期望(E),利用对隐 阅读全文

posted @ 2021-03-31 11:22 农夫三拳有點疼 阅读(1136) 评论(0) 推荐(1) 编辑

主题模型(Topic Model)

摘要: 1. LDA模型是什么 LDA可以分为以下5个步骤: 一个函数:gamma函数。 四个分布:二项分布、多项分布、beta分布、Dirichlet分布。 一个概念和一个理念:共轭先验和贝叶斯框架。 两个模型:pLSA、LDA。 一个采样:Gibbs采样 关于LDA有两种含义,一种是线性判别分析(Lin 阅读全文

posted @ 2021-03-31 10:54 农夫三拳有點疼 阅读(516) 评论(0) 推荐(0) 编辑

马尔科夫(Markov)

摘要: 1. 马尔可夫网络、马尔可夫模型、马尔可夫过程、贝叶斯网络的区别 以下共分六点说明这些概念,分成条目只是方便边阅读边思考,这6点是依次递进的,不要跳跃着看。 将随机变量作为结点,若两个随机变量相关或者不独立,则将二者连接一条边;若给定若干随机变量,则形成一个有向图,即构成一个网络。 如果该网络是有向 阅读全文

posted @ 2021-03-31 10:51 农夫三拳有點疼 阅读(1892) 评论(0) 推荐(1) 编辑

贝叶斯网络(Bayesian Network)

摘要: 1. 对概率图模型的理解 概率图模型是用图来表示变量概率依赖关系的理论,结合概率论与图论的知识,利用图来表示与模型有关的变量的联合概率分布。由图灵奖获得者Pearl开发出来。 如果用一个词来形容概率图模型(Probabilistic Graphical Model)的话,那就是“优雅”。对于一个实际 阅读全文

posted @ 2021-03-31 10:43 农夫三拳有點疼 阅读(1623) 评论(0) 推荐(0) 编辑

导航