2018年8月16日

2-1回归算法

摘要: 1.什么是回归算法 (1).回归算法是一种有监督算法 (2).回归算法是一种比较常用的机器学习算法,用来建立"解释"变量(自变量X)和观测值(因变量Y)之间的关系;从机器学习的角度来讲,用于构建一个算法模型(函数)来做属性(X)与标签(Y)之间的映射关系,在算法的学习过程中,试图寻找一个函数h: R 阅读全文

posted @ 2018-08-16 20:06 心梦无痕-梦回 阅读(111) 评论(0) 推荐(0) 编辑

14-章小结

摘要: 1.算法分类:有监督算法和无监督算法;或者=>回归.分类.聚类算法 有监督算法:训练数据中包含y值,也就是包含这个标签值(label的值);回归和分类都属于有监督算法 无监督算法:训练数据中不包含y值的,也就是算法的目的是找出数据中的隐含的规则,简单来讲就是将数据根据数据的特征划分为不同的类别/聚簇 阅读全文

posted @ 2018-08-16 19:30 心梦无痕-梦回 阅读(81) 评论(0) 推荐(0) 编辑

13-模型训练及测试

摘要: 模型选择:对特定任务最优建模方法的选择或者对特定模型最佳参数的选择 在训练数据集上运行模型(算法)并在测试数据集中测试效果,迭代进行数据模型的修改,这种方式呗称为交叉验证(将数据分为训练集和测试集,使用训练集构建模型,并使用测试i集评估模型提供修改建议) 模型的选择会尽可能多的选择算法进行执行,并比 阅读全文

posted @ 2018-08-16 15:43 心梦无痕-梦回 阅读(146) 评论(0) 推荐(0) 编辑

12-文本数据提取方法--简介

摘要: 词袋法: 统计文本中出现的各个单词出现的数量,使用单词出现的数量作为文本的特征向量,使用单词作为特征, 但是单词一般情况比较多,所以考虑使用自定义词典作为特征,然后对自定义词典中的单词出现的数量进行统计即可.(频数) 哑编码: 将有限个类别的特征属性转换为数值型的特征向量,也就是用向量的形式来表示特 阅读全文

posted @ 2018-08-16 11:51 心梦无痕-梦回 阅读(450) 评论(0) 推荐(0) 编辑

11-机器学习开发流程--初识

摘要: 1.数据收集与存储 数据来源: (1).用户访问行为数据 (2).业务数据 (3).外部第三方数据 数据存储: (1).需要存储的数据:原始数据,预处理后数据,模型结果 (2).存储设施:mysql,HDFS,HBase,Solr,Elasticsearch,Kafka,Redis等 数据收集方式: 阅读全文

posted @ 2018-08-16 10:07 心梦无痕-梦回 阅读(108) 评论(0) 推荐(0) 编辑

10-机器学习开发流程

摘要: 步骤: 1.数据收集 2.数据预处理 3.特征提取 4.模型构建 5.模型测试评估 6.投入使用(模型部署与整合) 7.迭代优化 阅读全文

posted @ 2018-08-16 08:24 心梦无痕-梦回 阅读(119) 评论(0) 推荐(0) 编辑

09-机器学习.人工智能和深度学习的关系

摘要: 1.深度学习是机器学习的子类;深度学习是基于传统的神经网络算法发展到多隐层的一种算法体现 2.机器学习是人工智能的一个子类 阅读全文

posted @ 2018-08-16 08:14 心梦无痕-梦回 阅读(112) 评论(0) 推荐(0) 编辑

2018年8月15日

08-机器学习的10大算法

摘要: 1. C4.5 分类决策树算法,决策树的核心算法,ID3算法的改进算法 2. CART 分类与回归树(Classification and Regression Tree) 3. KNN K近邻分类算法;如果一个样本在特征空间中的k个最相似的样本中大多数属于某一个类别,name该样本也属于该类别 4 阅读全文

posted @ 2018-08-15 20:40 心梦无痕-梦回 阅读(139) 评论(0) 推荐(0) 编辑

07-机器学习分类

摘要: 一.第一种分类方式(有无标签来分): 1.有监督学习:用已知某种或某些特性的样本作为训练集,以建立一个数学模型,再用已建立的模型来预测未知的样本,此种方法被称为有监督学习,是最常用的一种机器学习的方法.是从标签化训 练数据集中推断出模型的机器学习任务 有监督学习的不同方式: 判别式模型(Discri 阅读全文

posted @ 2018-08-15 20:23 心梦无痕-梦回 阅读(313) 评论(0) 推荐(0) 编辑

06-机器学习.数据分析.数据挖掘的区别于联系

摘要: 数据分析:数据分析是指用适当的统计分析方法对手机的大量数据进行分析,并提取有用的信息,以及形成结论,从而对数据进行详细的研究和概括过程.在实际工作中,数据分析可帮助人们做出判断;数据分析一般而言可以分为统计分析.探索性数据分析和验证性数据分析三大类. 数据挖掘:一般指从大量的数据中通过算法搜索隐藏于 阅读全文

posted @ 2018-08-15 19:17 心梦无痕-梦回 阅读(120) 评论(0) 推荐(0) 编辑

导航