上一页 1 ··· 20 21 22 23 24 25 26 27 28 ··· 58 下一页
摘要: 分类器性能评估 分类器性能评估 在许多实际问题中,衡量分类器任务的成功程度是通过固定的性能指标来获取。一般最常见使用的是准确率,即预测结果正确的百分比。然而有时候,我们关注的是负样本是否被正确诊断出来。例如,关于肿瘤的的判定,需要更加关心多少恶性肿瘤被正确的诊断出来。也就是说,在二类分类任务下,预测 阅读全文
posted @ 2019-01-20 12:39 zhangqi0828 阅读(172) 评论(0) 推荐(0) 编辑
摘要: 分类算法之决策树 分类算法之决策树 决策树是一种基本的分类方法,当然也可以用于回归。我们一般只讨论用于分类的决策树。决策树模型呈树形结构。在分类问题中,表示基于特征对实例进行分类的过程,它可以认为是if-then规则的集合。在决策树的结构中,每一个实例都被一条路径或者一条规则所覆盖。通常决策树学习包 阅读全文
posted @ 2019-01-20 12:39 zhangqi0828 阅读(412) 评论(0) 推荐(0) 编辑
摘要: 朴素贝叶斯 朴素贝叶斯 朴素贝叶斯(Naive Bayes)是一个非常简单,但是实用性很强的分类模型。朴素贝叶斯分类器的构造基础是贝叶斯理论。 概率论基础 概率定义为一件事情发生的可能性。事情发生的概率可以 通过观测数据中的事件发生次数来计算,事件发生的概率等于改事件发生次数除以所有事件发生的总次数 阅读全文
posted @ 2019-01-20 12:38 zhangqi0828 阅读(261) 评论(0) 推荐(0) 编辑
摘要: 分类算法之逻辑回归 分类算法之逻辑回归 逻辑回归(Logistic Regression),简称LR。它的特点是能够是我们的特征输入集合转化为0和1这两类的概率。一般来说,回归不用在分类问题上,因为回归是连续型模型,而且受噪声影响比较大。如果非要应用进入,可以使用逻辑回归。了解过线性回归之后再来看逻 阅读全文
posted @ 2019-01-20 12:38 zhangqi0828 阅读(274) 评论(0) 推荐(0) 编辑
摘要: 分类算法之k-近邻 分类算法之k-近邻 k-近邻算法采用测量不同特征值之间的距离来进行分类 优点:精度高、对异常值不敏感、无数据输入假定 缺点:计算复杂度高、空间复杂度高 使用数据范围:数值型和标称型 一个例子弄懂k-近邻 电影可以按照题材分类,每个题材又是如何定义的呢?那么假如两种类型的电影,动作 阅读全文
posted @ 2019-01-18 13:28 zhangqi0828 阅读(162) 评论(0) 推荐(0) 编辑
摘要: k-近邻算法案例分析 本案例使用最著名的”鸢尾“数据集,该数据集曾经被Fisher用在经典论文中,目前作为教科书般的数据样本预存在Scikit-learn的工具包中。 读入Iris数据集细节资料 from sklearn.datasets import load_iris # 使用加载器读取数据并且 阅读全文
posted @ 2019-01-18 13:28 zhangqi0828 阅读(792) 评论(0) 推荐(0) 编辑
摘要: estimator的工作流程 estimator的工作流程 在sklearn中,估计器(estimator)是一个重要的角色,分类器和回归器都属于estimator。在估计器中有有两个重要的方法是fit和transform。 fit方法用于从训练集中学习模型参数 transform用学习到的参数转换 阅读全文
posted @ 2019-01-18 13:26 zhangqi0828 阅读(741) 评论(0) 推荐(0) 编辑
摘要: 模型检验-交叉验证 模型检验-交叉验证 一般在进行模型的测试时,我们会将数据分为训练集和测试集。在给定的样本空间中,拿出大部分样本作为训练集来训练模型,剩余的小部分样本使用刚建立的模型进行预测。 训练集与测试集 训练集与测试集的分割可以使用cross_validation中的train_test_s 阅读全文
posted @ 2019-01-18 13:25 zhangqi0828 阅读(496) 评论(0) 推荐(0) 编辑
摘要: 模型的选择 模型的选择 算法是核心,数据和计算是基础。这句话很好的说明了机器学习中算法的重要性。那么我们开看下机器学习的几种分类: 监督学习 分类 k-近邻算法、决策树、贝叶斯、逻辑回归(LR)、支持向量机(SVM) 回归 线性回归、岭回归 标注 隐马尔可夫模型(HMM) 无监督学习 聚类 k-me 阅读全文
posted @ 2019-01-18 13:23 zhangqi0828 阅读(226) 评论(0) 推荐(0) 编辑
摘要: scikit-learn数据集 scikit-learn数据集 我们将介绍sklearn中的数据集类,模块包括用于加载数据集的实用程序,包括加载和获取流行参考数据集的方法。它还具有一些人工数据生成器。 sklearn.datasets (1)datasets.load_*() 获取小规模数据集,数据 阅读全文
posted @ 2019-01-18 13:17 zhangqi0828 阅读(247) 评论(0) 推荐(0) 编辑
上一页 1 ··· 20 21 22 23 24 25 26 27 28 ··· 58 下一页