摘要: 朴素贝叶斯优点:在数据较少的情况下仍然有效,可以处理多类别问题缺点:对于输入数据的准备方式较为敏感适用数据类型:标称型数据朴素贝叶斯决策理论的核心思想:选择具有最高概率的决策朴素贝叶斯的一般过程(1)收集数据:可以使用任何方法。(2)准备数据:需要数值型或者布尔型数据。(3)分析数据:有大量特征时, 阅读全文
posted @ 2018-07-22 21:19 我们都是大好青年 阅读(1980) 评论(0) 推荐(0) 编辑
摘要: 我们经常使用决策树处理分类问题,近年来的调查表明决策树也是经常使用的数据挖掘算法K-NN可以完成多分类任务,但是它最大的缺点是无法给出数据的内在含义,决策树的主要优势在于数据形式非常容易理解决策树的优缺点:优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据缺点:可能 阅读全文
posted @ 2018-07-22 19:57 我们都是大好青年 阅读(2918) 评论(0) 推荐(0) 编辑
摘要: K近邻算法概述优点:精度高、对异常数据不敏感、无数据输入假定缺点:计算复杂度高、空间复杂度高适用数据范围:数值型和标称型工作原理:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集 阅读全文
posted @ 2018-07-22 16:02 我们都是大好青年 阅读(249) 评论(0) 推荐(0) 编辑
摘要: 线性回归 回归是一种极易理解的模型,就相当于y=f(x),表明自变量 x 和因变量 y 的关系。最常见问题有如 医生治病时的望、闻、问、切之后判定病人是否生了什么病,其中的望闻问切就是获得自变量x,即特征数据,判断是否生病就相当于获取因变量y,即预测分类。 最简单的回归是线性回归,如图1.a所示,X 阅读全文
posted @ 2018-07-22 10:11 我们都是大好青年 阅读(9776) 评论(0) 推荐(0) 编辑
摘要: 什么是仿射变换? 原理:1、一个任意的仿射变换都能表示为 乘以一个矩阵(线性变换) 接着再 加上一个向量(平移) 2、综上所述,我们能够用仿射变换来表示: 1)旋转(线性变换) 2)平移(向量加) 3)缩放操作(线性变换) 事实上,仿射变换代表的是两幅图之间的关系。 3、我们通常使用2*3矩阵来表示 阅读全文
posted @ 2018-07-22 08:55 我们都是大好青年 阅读(597) 评论(0) 推荐(0) 编辑