VAE-GAN
摘要:转载:https://www.tinymind.net.cn/articles/94fb3ba97e1219 论文:Autoencoding beyond pixels usingALearnedSimilarityMmetric How does a VAE-GAN work? We have t
阅读全文
posted @
2020-06-13 14:28
chamie
阅读(679)
推荐(0) 编辑
Ubuntu14.04下安装Libsvm,并使用Libsvm
摘要:(1)Ubuntu14.04下安装Libsvm 转载:https://blog.csdn.net/katrinawj/article/details/78915874 一、下载: 网址:http://www.csie.ntu.edu.tw/~cjlin/libsvm/oldfiles/ ,选择lib
阅读全文
posted @
2018-09-14 19:43
chamie
阅读(185)
推荐(0) 编辑
极限学习机
摘要:本质:训练前只需设置网络隐层节点和激励函数,训练过程中随机产生网络的输入权值向量和隐层节点偏置,引入矩阵广义逆的思想解析得到网络的输出权值向量,训练过程快速简单,参数选择容易且具有良好的全局搜索能力。 优化点: (1)设置网络隐层节点个数:目前都是经验公式,没有确定的 (2)选择激励函数;目前大多数
阅读全文
posted @
2016-08-05 19:16
chamie
阅读(427)
推荐(0) 编辑
什么情况需要数据归一化处理?
摘要:当GDP变动百分之几的时候,可能往往数量是多少百万元,多少千万元,甚至多少亿元作为单位的量纲,但如果我们考察的是区域内的企业个数与GDP的关系时(比如做灰色关联度分析),就会出现变化相同的百分比,在绝对值上相差太多,一个的量纲是亿,而另一个的量纲却是个(毕竟区域内的企业一般也就几百到几千个),所以为
阅读全文
posted @
2016-08-04 22:05
chamie
阅读(4592)
推荐(0) 编辑
神经网络基本类型
摘要:神经网络的基本类型与学习算法: 目前已有的数十种神经网络模型,按网络结构划分可归纳为三大类:前馈网络、反馈网络和自组织网络。 前馈神经网络则是指神经元分层排列,分别组成输入层、中间层和输出层。每一层的神经元只接受来自前一层神经元的输入,后面的层对前面层没有信号反馈。输入模式经过各层的顺序传播,最后在
阅读全文
posted @
2016-06-13 10:56
chamie
阅读(11310)
推荐(0) 编辑
【Machine Learning in Action --5】逻辑回归(LogisticRegression)从疝气病预测病马的死亡率
摘要:背景:使用Logistic回归来预测患有疝气病的马的存活问题,这里的数据包括368个样本和28个特征,疝气病是描述马胃肠痛的术语,然而,这种病并不一定源自马的胃肠问题,其他问题也可能引发疝气病,该数据集中包含了医院检测马疝气病的一些指标,有的指标比较主观,有的指标难以测量,例如马的疼痛级别。另外,除...
阅读全文
posted @
2015-10-13 22:43
chamie
阅读(3723)
推荐(0) 编辑
【Machine Learning in Action --4】朴素贝叶斯从个人广告中获取区域倾向
摘要:背景:广告商往往想知道关于一个人的一些特定人口统计信息,以便能更好地定向推销广告。我们将分别从美国的两个城市中选取一些人,通过分析这些人发布的信息,来比较这两个城市的人们在广告用词上是否不同。如果结论确实不同,那么他们各自常用的词是那些,从人们的用词当中,我们能否对不同城市的人所关心的内容有所了解。...
阅读全文
posted @
2015-10-07 22:38
chamie
阅读(1058)
推荐(0) 编辑
【Machine Learning in Action --4】朴素贝叶斯电子邮件垃圾过滤
摘要:摘要:这里用的是词袋模型,即一个词在文档中出现不止一次,每个单词可以出现多次。1、准备数据:切分文本前一节过滤网站恶意留言中词向量是给定的,下面介绍如何从文本文档中构建自己的词列表先举例说明,在python提示符下输入:>>> mySent='This book is the best book o...
阅读全文
posted @
2015-10-07 20:07
chamie
阅读(1392)
推荐(0) 编辑
【Machine Learning in Action --4】朴素贝叶斯过滤网站的恶意留言
摘要:背景:以在线社区的留言板为例,为了不影响社区的发展,我们需要屏蔽侮辱性的言论,所以要构建一个快速过滤器,如果某条留言使用了负面或者侮辱性的语言,那么就将该留言标识为内容不当。过滤这类内容是一个很常见的需求,对此问题建立两个类别:侮辱类和非侮辱类,使用0和1分别表示。接下来首先给出将文本转换为数字向量...
阅读全文
posted @
2015-10-07 11:15
chamie
阅读(724)
推荐(0) 编辑
【Machine Learning in Action --4】朴素贝叶斯分类
摘要:1、概述朴素贝叶斯分类是贝叶斯分类器的一种,贝叶斯分类算法是统计学的一种分类方法,利用概率统计知识进行分类,其分类原理就是利用贝叶斯公式根据某对象的先验 概率计算出其后验概率(即该对象属于某一类的概率),然后选择具有最大后验概率的类作为该对象所属的类。总的来说:当样本特征个数较多或者特征之间相关性较...
阅读全文
posted @
2015-10-06 22:41
chamie
阅读(350)
推荐(0) 编辑
【Machine Learning in Action --3】决策树ID3算法预测隐形眼睛类型
摘要:本节讲解如何预测患者需要佩戴的隐形眼镜类型。1、使用决策树预测隐形眼镜类型的一般流程(1)收集数据:提供的文本文件(数据来源于UCI数据库)(2)准备数据:解析tab键分隔的数据行(3)分析数据:快速检查数据,确保正确地解析数据内容,使用createPlot()函数绘制最终的树形图(4)训练算法:c...
阅读全文
posted @
2015-09-29 23:08
chamie
阅读(811)
推荐(0) 编辑
【Machine Learning in Action --3】决策树ID3算法
摘要:1、简单概念描述 决策树的类型有很多,有CART、ID3和C4.5等,其中CART是基于基尼不纯度(Gini)的,这里不做详解,而ID3和C4.5都是基于信息熵的,它们两个得到的结果都是一样的,本次定义主要针对ID3算法。下面我们介绍信息熵的定义。 p(ai):事件ai发生的概率 I(ai)=...
阅读全文
posted @
2015-09-28 18:01
chamie
阅读(621)
推荐(0) 编辑
【Machine Learning in Action --2】K-近邻算法构造手写识别系统
摘要:为了简单起见,这里构造的系统只能识别数字0到9,需要识别的数字已经使用图形处理软件,处理成具有相同的色彩和大小:宽高是32像素的黑白图像。尽管采用文本格式存储图像不能有效地利用内存空间,但是为了方便理解,我们还是将图像转换为文本格式。---1.收集数据:提供文本文件 该数据集合修改自“手写数字...
阅读全文
posted @
2015-09-22 22:03
chamie
阅读(562)
推荐(0) 编辑
【Machine Learning in Action --2】K-近邻算法改进约会网站的配对效果
摘要:摘自:《机器学习实战》,用python编写的(需要matplotlib和numpy库) 海伦一直使用在线约会网站寻找合适自己的约会对象。尽管约会网站会推荐不同的人选,但她没有从中找到喜欢的人。经过一番总结,她发现曾交往过三种类型的人: 1.不喜欢的人(以下简称1 ); 2.魅力一般的人(以下简...
阅读全文
posted @
2015-09-22 20:56
chamie
阅读(631)
推荐(0) 编辑
【Machine Learning in Action --2】K-最近邻分类
摘要:1、K-近邻算法(KNN)概述K-近邻算法采用测量不同特征值之间的距离方法进行分类。工作原理:存在一个样本数据集合(也称作训练样本集),并且样本集中每个数据都存在标签(即我们知道样本集中每一数据与所属分类的对应关系)。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算...
阅读全文
posted @
2015-09-15 23:30
chamie
阅读(480)
推荐(0) 编辑
互联网公司机器学习数据挖掘类的职位面试主要考察哪些?
摘要:转载自:http://www.d1net.com/bigdata/news/326828.html,2015-01-05 11:27:28本文摘自:36大数据我觉得从事数据挖掘工作,尤其是在互联网行业,主要需要三个方面的能力,即机器学习和数据挖掘的理论知识、编程开发与数据结构算法的基础和业务理解与沟...
阅读全文
posted @
2015-07-31 20:53
chamie
阅读(1961)
推荐(0) 编辑
数据挖掘工程师面试指南
摘要:转载自:http://www.d1net.com/bigdata/news/326089.html,2014-12-31 11:12:54本文摘自:36大数据数据挖掘领域是一个独特的行业,通常的招聘方法可能不大适用于本行业的特点。在招聘一个合格的数据挖掘工程师时,公司一般关注以下三个方面:1、他聪明...
阅读全文
posted @
2015-07-31 20:31
chamie
阅读(610)
推荐(0) 编辑
目前数据挖掘类的岗位
摘要:***********************************************************************************************数据挖掘中的三种角色(转载自:http://www.d1net.com/bigdata/news/263885...
阅读全文
posted @
2015-07-29 17:10
chamie
阅读(871)
推荐(0) 编辑
数据挖掘十大经典算法
摘要:一、C4.5 C4.5,是机器学习算法中的一个分类决策树算法,它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法ID3的改进算法,所以基本上了解了一半决策树构造方法就能构造它。决策树构造方法其实就是每次选择一个好的特征以及分裂点作为当前节点的分类条件。二、The k-...
阅读全文
posted @
2015-07-26 18:41
chamie
阅读(38163)
推荐(1) 编辑