摘要:
算法概述 优点:计算复杂度不高,榆出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据。 缺点:可能会产生过度匹配问题。 适用数据范围: 数值型 和 标称型 。 算法流程 数据 样本数据(多维多行数据 + 标签) 预测数据(多维一行数据) 构建决策树 遍历数据集每一个 feature ,计算 阅读全文
摘要:
算法概述 通过测量不同特征值之间的距离进行 [分类] 优点:精度高、对异常值不敏感、无数据输入假定。 缺点:计算复杂度高、空间复杂度高。 适用数据范围: 数值型 和 标称型 。 算法流程 数据 样本数据(多维多行数据 + 标签) 预测数据(多维一行数据) 比较预测数据与样本数据的距离 欧氏距离 将样 阅读全文