Web 在线数据建模

08 2016 档案

摘要:一、安装JDK 1、用户可以在Oracle JDK的官网下载相应版本的JDK,本例以JDK 1.6为例,官网地址为http://www.oracle.com/tech-network/java/javase/downloads/index.html。 2、配置环境变量,在/etc/profile增加 阅读全文
posted @ 2016-08-26 14:58 NetUML大数据搜索 阅读(982) 评论(0) 推荐(2)
摘要:一、概述 当做重要决定时,大家可能都会考虑吸取多个专家而不只是一个人的意见。机器学习处理问题时又何尝不是如此?这就是元算法(meta-algorithm)背后的思路。元算法是对其他算法进行组合的一种方式。接下来我们将集中关注一个称作AdaBoost的最流行的元算法。由于某些人认为AdaBoost是最 阅读全文
posted @ 2016-08-04 13:51 NetUML大数据搜索 阅读(1799) 评论(0) 推荐(0)
摘要:一、概述 这会是激动人心的一章,因为我们将首次接触到最优化算法。仔细想想就会发现,其实我们日常生活中遇到过很多最优化问题,比如如何在最短时间内从A点到达B点?如何投入最少工作量却获得最大的效益?如何设计发动机使得油耗最少而功率最大?可见,最优化的作用十分强大。接下来,我们介绍几个最优化算法,并利用它 阅读全文
posted @ 2016-08-03 10:31 NetUML大数据搜索 阅读(2114) 评论(0) 推荐(5)
摘要:一、概述 前两章我们要求分类器做出艰难决策,给出“该数据实例属于哪一类”这类问题的明确答案。不过,分类器有时会产生错误结果,这时可以要求分类器给出一个最优的类别猜测结果,同时给出这个猜测的概率估计值。 概率论是许多机器学习算法的基础,所以深刻理解这一主题就显得十分重要。第3章在计算特征值取某个值的概 阅读全文
posted @ 2016-08-02 09:49 NetUML大数据搜索 阅读(1678) 评论(1) 推荐(3)
摘要:本节使用的算法称为ID3,另一个决策树构造算法CART以后讲解。 一、概述 我们经常使用决策树处理分类问题,它的过程类似二十个问题的游戏:参与游戏的一方在脑海里想某个事物,其他参与者向他提出问题,只允许提20个问 题,问题的答案也只能用对或错回答。问问题的人通过推断分解,逐步缩小带猜测事物的范围。 阅读全文
posted @ 2016-08-01 16:12 NetUML大数据搜索 阅读(4410) 评论(0) 推荐(7)
摘要:一、概述 k-近邻算法采用测量不同特征值之间的距离方法进行分类。 工作原理:首先有一个样本数据集合(训练样本集),并且样本数据集合中每条数据都存在标签(分类),即我们知道样本数据中每一条数据与所属分类的对应关系,输入没有标签的数据之后,将新数据的每个特征与样本集的数据对应的特征进行比较(欧式距离运算 阅读全文
posted @ 2016-08-01 09:49 NetUML大数据搜索 阅读(1882) 评论(1) 推荐(3)

Web 在线数据建模