2018年8月16日

2-1回归算法

摘要: 1.什么是回归算法 (1).回归算法是一种有监督算法 (2).回归算法是一种比较常用的机器学习算法,用来建立"解释"变量(自变量X)和观测值(因变量Y)之间的关系;从机器学习的角度来讲,用于构建一个算法模型(函数)来做属性(X)与标签(Y)之间的映射关系,在算法的学习过程中,试图寻找一个函数h: R 阅读全文

posted @ 2018-08-16 20:06 心梦无痕-梦回 阅读(111) 评论(0) 推荐(0) 编辑

14-章小结

摘要: 1.算法分类:有监督算法和无监督算法;或者=>回归.分类.聚类算法 有监督算法:训练数据中包含y值,也就是包含这个标签值(label的值);回归和分类都属于有监督算法 无监督算法:训练数据中不包含y值的,也就是算法的目的是找出数据中的隐含的规则,简单来讲就是将数据根据数据的特征划分为不同的类别/聚簇 阅读全文

posted @ 2018-08-16 19:30 心梦无痕-梦回 阅读(81) 评论(0) 推荐(0) 编辑

13-模型训练及测试

摘要: 模型选择:对特定任务最优建模方法的选择或者对特定模型最佳参数的选择 在训练数据集上运行模型(算法)并在测试数据集中测试效果,迭代进行数据模型的修改,这种方式呗称为交叉验证(将数据分为训练集和测试集,使用训练集构建模型,并使用测试i集评估模型提供修改建议) 模型的选择会尽可能多的选择算法进行执行,并比 阅读全文

posted @ 2018-08-16 15:43 心梦无痕-梦回 阅读(146) 评论(0) 推荐(0) 编辑

12-文本数据提取方法--简介

摘要: 词袋法: 统计文本中出现的各个单词出现的数量,使用单词出现的数量作为文本的特征向量,使用单词作为特征, 但是单词一般情况比较多,所以考虑使用自定义词典作为特征,然后对自定义词典中的单词出现的数量进行统计即可.(频数) 哑编码: 将有限个类别的特征属性转换为数值型的特征向量,也就是用向量的形式来表示特 阅读全文

posted @ 2018-08-16 11:51 心梦无痕-梦回 阅读(450) 评论(0) 推荐(0) 编辑

11-机器学习开发流程--初识

摘要: 1.数据收集与存储 数据来源: (1).用户访问行为数据 (2).业务数据 (3).外部第三方数据 数据存储: (1).需要存储的数据:原始数据,预处理后数据,模型结果 (2).存储设施:mysql,HDFS,HBase,Solr,Elasticsearch,Kafka,Redis等 数据收集方式: 阅读全文

posted @ 2018-08-16 10:07 心梦无痕-梦回 阅读(108) 评论(0) 推荐(0) 编辑

10-机器学习开发流程

摘要: 步骤: 1.数据收集 2.数据预处理 3.特征提取 4.模型构建 5.模型测试评估 6.投入使用(模型部署与整合) 7.迭代优化 阅读全文

posted @ 2018-08-16 08:24 心梦无痕-梦回 阅读(119) 评论(0) 推荐(0) 编辑

09-机器学习.人工智能和深度学习的关系

摘要: 1.深度学习是机器学习的子类;深度学习是基于传统的神经网络算法发展到多隐层的一种算法体现 2.机器学习是人工智能的一个子类 阅读全文

posted @ 2018-08-16 08:14 心梦无痕-梦回 阅读(112) 评论(0) 推荐(0) 编辑

导航