随笔分类 - 深度学习
摘要:MMD讲解 描述一个随机变量 去描述一个随机变量,最直接的方法就是给出它的概率分布函数。一些简单的分布可以这么干,比如正态分布给出均值和方差就可以确定,但是对于一些复杂的、高维的随机变量,我们无法给出它们的分布函数。 这时候我们可以用随机变量的矩来描述一个随机变量,比如一阶中心矩是均
阅读全文
摘要:再生希尔伯特空间与核函数讲解 空间 空间的概念就是 空间 = 集合 + 结构 线性空间/向量空间(Linear Space/Vector Space) 线性空间就是 线性空间 = 集合 + 线性结构 ,而其中的线性结构就是 线性结构 = 加法 + 数乘 简单说线性空间就是一系列向量的集合并且只满足加
阅读全文
摘要:流形学习 数据降维问题 在很多应用中,数据的维数会很高。以图像数据为例,我们要识别32x32的手写数字图像,如果将像素按行或者列拼接起来形成向量,这个向量的维数是1024。高维的数据不仅给机器学习算法带来挑战,而且导致计算量大,此外还会面临维数灾难的问题(这一问题可以直观的理解成特征向量维数越高,机
阅读全文
摘要:聚类 1.聚类 定义 聚类(Clustering)是按照某个特定标准(如距离)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。也即聚类后同一类的数据尽可能聚集到一起,不同类数据尽量分离。 聚类和分类的区别 聚类(Cluste
阅读全文
摘要:经验风险最小化与结构风险最小化 经验风险最小化 经验风险最小化的策略认为,经验风险最小的模型是最优的模型: 当样本容量足够大时,经验风险最小化能保证有很好的学习效果。比如,极大似
阅读全文
摘要:全连接层、softmax的loss
阅读全文
摘要:pytorch实现mnist识别实战
阅读全文