有多少人工,就有多少智能
上一页 1 ··· 19 20 21 22 23 24 25 26 27 ··· 29 下一页
摘要: SMO 是由 Platt 在 1998 年提出的、针对软间隔最大化 SVM 对偶问题求解的一个算法,其基本思想很简单:在每一步优化中,挑选出诸多参数()中的两个参数(、)作为“真正的参数”,其余参数都视为常数,从而问题就变成了类似于二次方程求最大值的问题,从而我们就能求出解析解 具体而言,SMO 要 阅读全文
posted @ 2021-02-23 20:06 lvdongjie-avatarx 阅读(448) 评论(0) 推荐(0) 编辑
摘要: SVM 由线性分类开始 理解SVM,咱们必须先弄清楚一个概念:线性分类器。 给定一些数据点,它们分别属于两个不同的类,现在要找到一个线性分类器把这些数据分成两类。如果用x表示数据点,用y表示类别(y可以取1或者-1,分别代表两个不同的类),一个线性分类器的目标是要在n维的数据空间中找到一个超平面(h 阅读全文
posted @ 2021-02-23 20:02 lvdongjie-avatarx 阅读(115) 评论(0) 推荐(0) 编辑
摘要: https://scikit-learn.org/stable/search.html?q=distance 阅读全文
posted @ 2021-01-21 07:32 lvdongjie-avatarx 阅读(23) 评论(0) 推荐(0) 编辑
摘要: 谱聚类(spectral clustering)是广泛使用的聚类算法,比起传统的K-Means算法,谱聚类对数据分布的适应性更强,聚类效果也很优秀,同时聚类的计算量也小很多,更加难能可贵的是实现起来也不复杂。在处理实际的聚类问题时,个人认为谱聚类是应该首先考虑的几种算法之一。下面我们就对谱聚类的算法 阅读全文
posted @ 2021-01-20 08:14 lvdongjie-avatarx 阅读(185) 评论(0) 推荐(0) 编辑
摘要: 1 引言 2014年6月,Alex Rodriguez和Alessandro Laio在ScienceScience上发表了一篇名为《Clustering by fast search and find of density peaks》的文章,提供了一种简洁而优美的聚类算法,是一种基于密度的聚类方 阅读全文
posted @ 2021-01-20 07:51 lvdongjie-avatarx 阅读(816) 评论(0) 推荐(0) 编辑
摘要: https://scikit-learn.org/stable/modules/generated/sklearn.cluster.DBSCAN.html?highlight=dbsc#sklearn.cluster.DBSCAN 阅读全文
posted @ 2021-01-19 21:46 lvdongjie-avatarx 阅读(83) 评论(0) 推荐(0) 编辑
摘要: 一、前言 DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)是一种基于密度的空间聚类算法。 该算法将具有足够密度的区域划分为簇,并在具有噪声的空间数据库中发现任意形状的簇,它将簇定义为密 阅读全文
posted @ 2021-01-19 20:45 lvdongjie-avatarx 阅读(278) 评论(0) 推荐(0) 编辑
摘要: BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies)天生就是为处理超大规模(至少要让你的内存容不下)的数据集而设计的,它可以在任何给定的内存下运行。关于BIRCH的更多特点先不介绍,我先讲一下算法的完整实现细节,对算法 阅读全文
posted @ 2021-01-19 20:02 lvdongjie-avatarx 阅读(830) 评论(0) 推荐(0) 编辑
摘要: https://scikit-learn.org/stable/modules/generated/sklearn.cluster.AgglomerativeClustering.html?highlight=agg#sklearn.cluster.AgglomerativeClustering h 阅读全文
posted @ 2021-01-19 19:47 lvdongjie-avatarx 阅读(41) 评论(0) 推荐(0) 编辑
摘要: 不管是GMM,还是k-means,都面临一个问题,就是k的个数如何选取?比如在bag-of-words模型中,用k-means训练码书,那么应该选取多少个码字呢?为了不在这个参数的选取上花费太多时间,可以考虑层次聚类。 假设有N个待聚类的样本,对于层次聚类来说,基本步骤就是: 1、(初始化)把每个样 阅读全文
posted @ 2021-01-19 19:30 lvdongjie-avatarx 阅读(107) 评论(0) 推荐(0) 编辑
上一页 1 ··· 19 20 21 22 23 24 25 26 27 ··· 29 下一页