摘要:
1. kNN算法:就看测试向量距哪种更近,前 k 个最近的点中哪类多,预测结果就是哪类。 2. 决策树:选择用来划分数据集的最好特征(最大的$infoGain = baseEntropy newEntropy$),对该特征的每一个值创建一个子节点,递归至label完全相同或已用完所有特征。 3. 朴 阅读全文
摘要:
混淆矩阵 | 预测结果 真实结果 | \+1(正例) | \ 1(反例) | | | | | | \+1 | 真正例(TP) | 伪反例(FN) | | \ 1 | 伪正例(FP) | 真反例(TN) | 正确率=TP/(TP+FP) 召回率=TP/(TP+FN) 假阳率=FP/(FP+TN) 真阳 阅读全文
摘要:
机器学习基础 ============ 监督学习简介 监督学习的两个任务: 分类 和 回归分析 (预测数值型数据)。 分类思路 分类方法思路: 这个表至关重要,叫做特征向量表 | | 特征1 | 特征2 | … | 目的变量(类别) | |: :|: :|: :|: :|: :| | 实例1 | … 阅读全文
摘要:
layout: post title: "机器学习实战笔记 6 支持向量机" categories: 机器学习 tags: 机器学习 支持向量机 SVM author: YunYuan mathjax: true 支持向量机 1. 优缺点:优点:泛化错误率低,计算开销不大,结果易解释;缺点:对参数调 阅读全文