随笔分类 -  Machine Learning and Optimization

摘要:摘自:Sener, Ozan, et al. "Unsupervised semantic parsing of video collections." Proceedings of the IEEE International Conference on Computer Vision. 2015 阅读全文
posted @ 2020-08-20 14:56 Picassooo 阅读(352) 评论(0) 推荐(0) 编辑
摘要:二分图定义 二分图又称作二部图,是图论中的一种特殊模型。 设G=(V,E)是一个无向图,如果顶点V可分割为两个互不相交的子集(A,B),并且图中的每条边(i,j)所关联的两个顶点i和j分别属于这两个不同的顶点集(i in A,j in B),则称图G为一个二分图。简而言之,就是顶点集V可分割为两个互 阅读全文
posted @ 2020-08-20 10:02 Picassooo 阅读(3024) 评论(0) 推荐(0) 编辑
摘要:scikit-learn中的KMeans聚类实现( + MiniBatchKMeans) 阅读全文
posted @ 2020-08-17 22:52 Picassooo 阅读(227) 评论(0) 推荐(0) 编辑
摘要:上一篇博客介绍了准确率和F值这两个评估模型分类性能的指标,它们在聚类模型上的应用会稍微复杂一点点。 下文摘自知乎几种常见的聚类评估指标。 假设我们现在有猫狗图片100张,其中猫又25张,狗有75张。现在我们通过某种聚类算法对其进行聚类,聚类的结果为簇A中有38张图片(其中20张猫18张狗),簇B中有 阅读全文
posted @ 2020-07-31 23:07 Picassooo 阅读(7050) 评论(0) 推荐(0) 编辑
摘要:本文的部分内容摘自韩家炜《数据挖掘》 四个术语 混淆矩阵(Confusion Matrix) 评估度量 还有一个术语:负正类率(false positive rate, FPR),也叫做打扰率计算公式为:FPR=FP/(FP+TN)=FP/N。负正类率计算的是分类器错认为正类的负实例占所有负实例的比 阅读全文
posted @ 2020-07-31 16:52 Picassooo 阅读(2094) 评论(0) 推荐(0) 编辑
摘要:本文转自:标准化互信息NMI计算步骤及其Python实现 标准化互信息NMI (Normalized Mutual Information)常用在聚类评估中。 标准化互信息NMI计算步骤 Python 实现 代码: ''' 利用Python实现NMI计算''' import math import 阅读全文
posted @ 2020-07-31 13:21 Picassooo 阅读(10972) 评论(0) 推荐(0) 编辑
摘要:本文摘自: 互信息 阅读全文
posted @ 2020-07-30 22:19 Picassooo 阅读(577) 评论(0) 推荐(0) 编辑
摘要:本文摘自: 郭岩, 罗珞珈, 汪洋, 付琨. 一种基于DTW改进的轨迹相似度算法[J]. 国外电子测量技术, 2016, 35(009):66-71. 轨迹数据 基于欧氏距离的相似度算法 基于时间动态规整(Dynamic Time Wraping, DTW)的相似度算法 此外,博客算法笔记-DTW动 阅读全文
posted @ 2020-07-27 11:27 Picassooo 阅读(2909) 评论(0) 推荐(0) 编辑
摘要:本文摘自Digital Image Processing chapter 3.4 and 4.2,third eidtion, Rafael C. Gonzalez, Richard E. Woods 阅读全文
posted @ 2020-07-23 20:34 Picassooo 阅读(846) 评论(0) 推荐(0) 编辑
摘要:本文部分内容摘自: [1]. Computer vision - a modern approch, section21.4. 2002. David A. Forths et al. [2]. 马尔科夫链 1. Markov chain 2. Hidden Markov Modelson Disc 阅读全文
posted @ 2020-07-17 15:11 Picassooo 阅读(330) 评论(0) 推荐(0) 编辑
摘要:交替方向乘子法( Alternating Direction Method of Multipliers, ADMM)是一种常用的优化方法,本文详细地介绍了此方法,并用矩阵低秩表示作为例子,对每一个变量的迭代公式进行了详细推导。 阅读全文
posted @ 2020-07-14 22:47 Picassooo 阅读(1063) 评论(0) 推荐(0) 编辑
摘要:在数据样本矩阵中,我们常用一列表示一个样本,一行表示一个特征。 阅读全文
posted @ 2020-07-13 12:52 Picassooo 阅读(870) 评论(0) 推荐(0) 编辑
摘要:首先推荐这个知乎文章,讲的挺好的:https://zhuanlan.zhihu.com/p/40991784 本文摘自:通俗易懂讲明白 最大似然和EM算法 最大似然 我们需要找到一个参数θ,其对应的似然函数L(θ) 最大,也就是说抽到这100 个男生(的身高)概率最大。这个叫做 θ 的最大似然估计量 阅读全文
posted @ 2020-07-11 21:02 Picassooo 阅读(885) 评论(0) 推荐(0) 编辑
摘要:MOOC课程:图论基础 阅读全文
posted @ 2020-07-11 13:24 Picassooo 阅读(127) 评论(0) 推荐(0) 编辑
摘要:1. 邻接矩阵,度矩阵,拉普拉斯矩阵 给定一个无向图: 我们可以用邻接矩阵(Adjacent Matrix)表示它: 把这个邻接矩阵记为W,W中的1表示有连接,0表示没有连接,例如第一行第二列的1表示图的节点1和节点2有连接,第一行第三列的0表示图的节点1和节点3没有连接在一起。因为是无向图,所以W 阅读全文
posted @ 2020-07-11 11:25 Picassooo 阅读(2774) 评论(0) 推荐(0) 编辑
摘要:Linear Methods Lower-dimensional linear projection preserves distances between all points. Nonlinear Methods Lower-dimensional projection preserves lo 阅读全文
posted @ 2020-07-11 11:00 Picassooo 阅读(315) 评论(0) 推荐(0) 编辑
摘要:指示向量里的元素只能为0或者1,并且只能有一个1,例如(0,0,1,0)T就是一个指示向量,(1,0,1,0,0,0)T不是指示向量。 我们可以用指示向量来表示单分类问题: 阅读全文
posted @ 2020-07-09 20:41 Picassooo 阅读(1923) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2020-07-05 22:34 Picassooo 阅读(2114) 评论(0) 推荐(0) 编辑
摘要:1. 算法步骤 随机选取k个样本点充当k个簇的中心点; 计算所有样本点与各个簇中心之间的距离,然后把样本点划入最近的簇中; 根据簇中已有的样本点,重新计算簇中心; 重复步骤2和3,直到簇中心不再改变或改变很小。 2. 手动Python实现 import numpy as np import matp 阅读全文
posted @ 2020-07-01 20:26 Picassooo 阅读(2062) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示