摘要: 达梦数据库入门技术总结 阅读全文
posted @ 2019-12-03 10:21 lc19861217 阅读(3765) 评论(0) 推荐(0) 编辑
摘要: PS:因为没有找到实际应用的场景,所以两个示例直接采用了官网的示例。以后遇到实际的应用场景了,再替换成实际的例子。 1.算法简介 双聚类简单来说就是在数据矩阵A中寻找一个满足条件矩阵B1的子矩阵A1,而B1是条件矩阵B的一个子矩阵. 2.算法常用的计算模型 目前定义双聚类算法有四种比较广泛的方式:( 阅读全文
posted @ 2018-07-03 10:15 lc19861217 阅读(9997) 评论(0) 推荐(1) 编辑
摘要: 1.空间维度 对于0维,现在普遍的说法就是一个无线小的点,并且没有长度、没有方向。我们也从这种说法开始。 0维是一个点,点的运动形成一条线,也就形成了1维空间,为了方便理解和减少争议,我们姑且认为0维的点是左右移动形成的线(空间坐标系的X轴)。1维的线前后移动形成了面,也就是2维空间(空间坐标系的Y 阅读全文
posted @ 2018-05-11 15:03 lc19861217 阅读(828) 评论(0) 推荐(0) 编辑
摘要: 1.前言 本来想做一个比较完善的监控平台,只需要做少许改动就可以直接拿来用,但是在做的过程中发现要实现这个目标所需的工作量太大,而当前的工作中对其需求又不是特别明显。所以就退而求其次,做了一个类似教程系统的东西。在这个系统中,你应该可以找到做一个监控系统所需要的大部分技术点,而它的真正意义就在于其打 阅读全文
posted @ 2018-04-17 13:46 lc19861217 阅读(1984) 评论(0) 推荐(0) 编辑
摘要: 说明:这篇文章需要有一些相关的基础知识,否则看起来可能比较吃力。 1.卷积与神经元 1.1 什么是卷积? 简单来说,卷积(或内积)就是一种先把对应位置相乘然后再把结果相加的运算。(具体含义或者数学公式可以查阅相关资料) 如下图就表示卷积的运算过程: (图1) 卷积运算一个重要的特点就是,通过卷积运算 阅读全文
posted @ 2017-08-09 13:56 lc19861217 阅读(53472) 评论(4) 推荐(7) 编辑
摘要: 1.关于Keras 1)简介 Keras是由纯python编写的基于theano/tensorflow的深度学习框架。 Keras是一个高层神经网络API,支持快速实验,能够把你的idea迅速转换为结果,如果有如下需求,可以优先选择Keras: a)简易和快速的原型设计(keras具有高度模块化,极 阅读全文
posted @ 2017-07-07 15:17 lc19861217 阅读(35234) 评论(12) 推荐(3) 编辑
摘要: 1.特征选择 特征选择是降维的一种方法,即选择对预测结果相关度高的特征或者消除相似度高的特征,以提高估计函数的准确率或者提高多维度数据集上的性能。 2.删除低方差特征 1)思路:设置一个阀值,对每个特征求方差,如果所求方差低于这个阀值,则删除此特征。默认情况下会删除0方差。 2)核心函数 sklea 阅读全文
posted @ 2017-07-06 14:23 lc19861217 阅读(1878) 评论(0) 推荐(1) 编辑
摘要: 1.梯度下降 1)什么是梯度下降? 因为梯度下降是一种思想,没有严格的定义,所以用一个比喻来解释什么是梯度下降。 简单来说,梯度下降就是从山顶找一条最短的路走到山脚最低的地方。但是因为选择方向的原因,我们找到的的最低点可能不是真正的最低点。如图所示,黑线标注的路线所指的方向并不是真正的地方。 既然是 阅读全文
posted @ 2017-06-27 14:37 lc19861217 阅读(2330) 评论(1) 推荐(1) 编辑
摘要: 1.再提逻辑回归 前面已经讲过了逻辑回归,这里不再细讲,只是简单的说一个函数,主要是方便大家更好的理解概率校准。 在逻辑回归中,用的最多的就是sigmod函数,这个函数的作用就是把无限大或者无限小的数据压缩到[0,1]之间,用来估计概率。图像大致为: 基本上是以0.5分界,0.5以上为1,0.5以下 阅读全文
posted @ 2017-06-23 11:19 lc19861217 阅读(5724) 评论(0) 推荐(1) 编辑
摘要: 1.数学定义 保序回归是回归算法的一种,基本思想是:给定一个有限的实数集合,训练一个模型来最小化下列方程: 并且满足下列约束条件: 2.算法过程说明 从该序列的首元素往后观察,一旦出现乱序现象停止该轮观察,从该乱序元素开始逐个吸收元素组成一个序列,直到该序列所有元素的平均值小于或等于下一个待吸收的元 阅读全文
posted @ 2017-06-15 08:41 lc19861217 阅读(6034) 评论(0) 推荐(0) 编辑
摘要: 1.概述 线性判别式分析(Linear Discriminant Analysis),简称为LDA。也称为Fisher线性判别(Fisher Linear Discriminant,FLD),是模式识别的经典算法,在1996年由Belhumeur引入模式识别和人工智能领域。 基本思想是将高维的模式样 阅读全文
posted @ 2017-06-13 14:15 lc19861217 阅读(6060) 评论(1) 推荐(0) 编辑
摘要: 考虑到学习知识的顺序及效率问题,所以后续的几种聚类方法不再详细讲解原理,也不再写python实现的源代码,只介绍下算法的基本思路,使大家对每种算法有个直观的印象,从而可以更好的理解函数中参数的意义及作用,而重点是放在如何使用及使用的场景。 (题外话: 今天看到一篇博文:刚接触机器学习这一个月我都做了 阅读全文
posted @ 2017-06-08 16:48 lc19861217 阅读(54085) 评论(2) 推荐(5) 编辑
摘要: 1.算法简介 AP(Affinity Propagation)通常被翻译为近邻传播算法或者亲和力传播算法,是在2007年的Science杂志上提出的一种新的聚类算法。AP算法的基本思想是将全部数据点都当作潜在的聚类中心(称之为exemplar),然后数据点两两之间连线构成一个网络(相似度矩阵),再通 阅读全文
posted @ 2017-05-26 13:10 lc19861217 阅读(28028) 评论(11) 推荐(6) 编辑
摘要: 1.简介 K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。 2. 算法大致流程为: 1)随机选取k个点作为种子点(这k个 阅读全文
posted @ 2017-05-23 14:20 lc19861217 阅读(19429) 评论(0) 推荐(1) 编辑
摘要: 1.简介(只是简单介绍下理论内容帮助理解下面的代码,如果自己写代码实现此理论不够) 1) BP神经网络是一种多层网络算法,其核心是反向传播误差,即: 使用梯度下降法(或其他算法),通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。 BP神经网络模型拓扑结构包括输入层(input)、隐藏 阅读全文
posted @ 2017-05-16 15:12 lc19861217 阅读(13519) 评论(0) 推荐(0) 编辑