2018 年 8月 16 日随笔档案 - 心梦无痕-梦回

2-1回归算法

摘要： 1.什么是回归算法 (1).回归算法是一种有监督算法 (2).回归算法是一种比较常用的机器学习算法,用来建立"解释"变量(自变量X)和观测值(因变量Y)之间的关系;从机器学习的角度来讲,用于构建一个算法模型(函数)来做属性(X)与标签(Y)之间的映射关系,在算法的学习过程中,试图寻找一个函数h: R 阅读全文

posted @ 2018-08-16 20:06 心梦无痕-梦回阅读(111) 评论(0) 推荐(0) 编辑

14-章小结

摘要： 1.算法分类:有监督算法和无监督算法;或者=>回归.分类.聚类算法有监督算法:训练数据中包含y值,也就是包含这个标签值(label的值);回归和分类都属于有监督算法无监督算法:训练数据中不包含y值的,也就是算法的目的是找出数据中的隐含的规则,简单来讲就是将数据根据数据的特征划分为不同的类别/聚簇阅读全文

posted @ 2018-08-16 19:30 心梦无痕-梦回阅读(81) 评论(0) 推荐(0) 编辑

13-模型训练及测试

摘要：模型选择:对特定任务最优建模方法的选择或者对特定模型最佳参数的选择在训练数据集上运行模型(算法)并在测试数据集中测试效果,迭代进行数据模型的修改,这种方式呗称为交叉验证(将数据分为训练集和测试集,使用训练集构建模型,并使用测试i集评估模型提供修改建议) 模型的选择会尽可能多的选择算法进行执行,并比阅读全文

posted @ 2018-08-16 15:43 心梦无痕-梦回阅读(146) 评论(0) 推荐(0) 编辑

12-文本数据提取方法--简介

摘要：词袋法: 统计文本中出现的各个单词出现的数量,使用单词出现的数量作为文本的特征向量,使用单词作为特征, 但是单词一般情况比较多,所以考虑使用自定义词典作为特征,然后对自定义词典中的单词出现的数量进行统计即可.(频数) 哑编码: 将有限个类别的特征属性转换为数值型的特征向量,也就是用向量的形式来表示特阅读全文

posted @ 2018-08-16 11:51 心梦无痕-梦回阅读(450) 评论(0) 推荐(0) 编辑

11-机器学习开发流程--初识

摘要： 1.数据收集与存储数据来源: (1).用户访问行为数据 (2).业务数据 (3).外部第三方数据数据存储: (1).需要存储的数据:原始数据,预处理后数据,模型结果 (2).存储设施:mysql,HDFS,HBase,Solr,Elasticsearch,Kafka,Redis等数据收集方式: 阅读全文

posted @ 2018-08-16 10:07 心梦无痕-梦回阅读(108) 评论(0) 推荐(0) 编辑

10-机器学习开发流程

摘要：步骤: 1.数据收集 2.数据预处理 3.特征提取 4.模型构建 5.模型测试评估 6.投入使用(模型部署与整合) 7.迭代优化阅读全文

posted @ 2018-08-16 08:24 心梦无痕-梦回阅读(119) 评论(0) 推荐(0) 编辑

09-机器学习.人工智能和深度学习的关系

摘要： 1.深度学习是机器学习的子类;深度学习是基于传统的神经网络算法发展到多隐层的一种算法体现 2.机器学习是人工智能的一个子类阅读全文

posted @ 2018-08-16 08:14 心梦无痕-梦回阅读(112) 评论(0) 推荐(0) 编辑

心梦无痕-梦回