摘要:
邻域保持嵌入(NPE)是流形学习里较为常用的一种线性学习算法,被广泛应用于过程监测中。本文首先介绍 NPE 的算法思想及步骤,接着列出了算法的推导,最后给出其代码实现。 阅读全文
摘要:
收缩自编码器(CAE)不仅可以作为非线性降维的工具,还可以用于学习流形结构。本文首先介绍一些基础知识,然后详细描述收缩自编码器,最后给出基于 Keras 的代码实现。 阅读全文
摘要:
线性因子模型是基于潜变量的最简单的概率模型,时常被用来作为混合模型或者更大的深度概率模型的组成模块。本文首先介绍线性因子模型的一般形式,然后再罗列一些特殊情况下的典型线性因子模型,方便日后学习。 阅读全文
摘要:
流形是机器学习中很多想法内在的重要概念。机器学习是从数据中来学习的,而对于数据有一条很重要的定律,叫流形分布定律,讲的是自然界中同一类别的高维数据,往往集中在某个低维流形附近,因此我们机器学习如果能直接学习到数据所在或最靠近的那个流形,那么我们将学到数据最本质的特征以及分布。 阅读全文
摘要:
机器学习的目标是通过经验来改善某个任务在某个性能上的表现,而改善过程则是通过训练数据来进行参数估计的。其中需要去估计的参数是相应机器学习算法中的模型参数,得到的估计值越接近数据真实概率分布中的参数,那么算法的模型分布和训练集上的经验分布之间的差异就越小。 阅读全文
摘要:
整理下机器学习涉及的概率论里面的各种概率分布和处理概率分布常用的函数,特别是带有公式的,方便日后查看,为机器学习算法的学习打下基础。 阅读全文