摘要:
第三章 决策树 3.1 算法简介 决策树就像一个数据流程图,区别在于决策树可以在不熟悉的数据集中,提取规则,进而构造出一棵决策树 优点:计算复杂度不高,输出的结果易于理解, 对中间缺省值不敏感,可以处理不想关的特征 缺点:容易发生过度匹配 适用的数据类型:数值型和标称型 3.2 算法的一般流程 1. 阅读全文
摘要:
第二章 k近邻 2.1 算法描述 (1)采用测量不同特征值之间的距离进行分类 优点:对异常点不敏感,精度高,无数据输入设定 缺点:空间,计算复杂度高 适合数据:标称与数值 (2)算法的工作原理: 基于已有的带有标签的训练数据,计算出需要预测的数据与每个训练数据之间的距离,找到其中距离最近的k个数据, 阅读全文