随笔分类 - Machine Learning and Optimization
摘要:摘自:Sener, Ozan, et al. "Unsupervised semantic parsing of video collections." Proceedings of the IEEE International Conference on Computer Vision. 2015
阅读全文
摘要:二分图定义 二分图又称作二部图,是图论中的一种特殊模型。 设G=(V,E)是一个无向图,如果顶点V可分割为两个互不相交的子集(A,B),并且图中的每条边(i,j)所关联的两个顶点i和j分别属于这两个不同的顶点集(i in A,j in B),则称图G为一个二分图。简而言之,就是顶点集V可分割为两个互
阅读全文
摘要:scikit-learn中的KMeans聚类实现( + MiniBatchKMeans)
阅读全文
摘要:上一篇博客介绍了准确率和F值这两个评估模型分类性能的指标,它们在聚类模型上的应用会稍微复杂一点点。 下文摘自知乎几种常见的聚类评估指标。 假设我们现在有猫狗图片100张,其中猫又25张,狗有75张。现在我们通过某种聚类算法对其进行聚类,聚类的结果为簇A中有38张图片(其中20张猫18张狗),簇B中有
阅读全文
摘要:本文的部分内容摘自韩家炜《数据挖掘》 四个术语 混淆矩阵(Confusion Matrix) 评估度量 还有一个术语:负正类率(false positive rate, FPR),也叫做打扰率计算公式为:FPR=FP/(FP+TN)=FP/N。负正类率计算的是分类器错认为正类的负实例占所有负实例的比
阅读全文
摘要:本文转自:标准化互信息NMI计算步骤及其Python实现 标准化互信息NMI (Normalized Mutual Information)常用在聚类评估中。 标准化互信息NMI计算步骤 Python 实现 代码: ''' 利用Python实现NMI计算''' import math import
阅读全文
摘要:本文摘自: 郭岩, 罗珞珈, 汪洋, 付琨. 一种基于DTW改进的轨迹相似度算法[J]. 国外电子测量技术, 2016, 35(009):66-71. 轨迹数据 基于欧氏距离的相似度算法 基于时间动态规整(Dynamic Time Wraping, DTW)的相似度算法 此外,博客算法笔记-DTW动
阅读全文
摘要:本文摘自Digital Image Processing chapter 3.4 and 4.2,third eidtion, Rafael C. Gonzalez, Richard E. Woods
阅读全文
摘要:本文部分内容摘自: [1]. Computer vision - a modern approch, section21.4. 2002. David A. Forths et al. [2]. 马尔科夫链 1. Markov chain 2. Hidden Markov Modelson Disc
阅读全文
摘要:交替方向乘子法( Alternating Direction Method of Multipliers, ADMM)是一种常用的优化方法,本文详细地介绍了此方法,并用矩阵低秩表示作为例子,对每一个变量的迭代公式进行了详细推导。
阅读全文
摘要:在数据样本矩阵中,我们常用一列表示一个样本,一行表示一个特征。
阅读全文
摘要:首先推荐这个知乎文章,讲的挺好的:https://zhuanlan.zhihu.com/p/40991784 本文摘自:通俗易懂讲明白 最大似然和EM算法 最大似然 我们需要找到一个参数θ,其对应的似然函数L(θ) 最大,也就是说抽到这100 个男生(的身高)概率最大。这个叫做 θ 的最大似然估计量
阅读全文
摘要:1. 邻接矩阵,度矩阵,拉普拉斯矩阵 给定一个无向图: 我们可以用邻接矩阵(Adjacent Matrix)表示它: 把这个邻接矩阵记为W,W中的1表示有连接,0表示没有连接,例如第一行第二列的1表示图的节点1和节点2有连接,第一行第三列的0表示图的节点1和节点3没有连接在一起。因为是无向图,所以W
阅读全文
摘要:Linear Methods Lower-dimensional linear projection preserves distances between all points. Nonlinear Methods Lower-dimensional projection preserves lo
阅读全文
摘要:指示向量里的元素只能为0或者1,并且只能有一个1,例如(0,0,1,0)T就是一个指示向量,(1,0,1,0,0,0)T不是指示向量。 我们可以用指示向量来表示单分类问题:
阅读全文
摘要:1. 算法步骤 随机选取k个样本点充当k个簇的中心点; 计算所有样本点与各个簇中心之间的距离,然后把样本点划入最近的簇中; 根据簇中已有的样本点,重新计算簇中心; 重复步骤2和3,直到簇中心不再改变或改变很小。 2. 手动Python实现 import numpy as np import matp
阅读全文