2020年7月10日

什么是NP完全问题

摘要: 在学习决策树的时候,我们知道,其一大特点是:寻找最佳的决策树是NP完成问题。什么是NP完全问题,决策树的这一特点又是什么意思? 什么是NP完全问题 这里的NP其实是Non-deterministic Polynomial的缩写,即多项式复杂程度的非确定性问题,NP完全问题有时也会简称为NP-C问题。 阅读全文

posted @ 2020-07-10 05:55 为主而活 阅读(4832) 评论(0) 推荐(1) 编辑

2020年7月9日

分类效果评价指标二-ROC曲线与AUC面积

摘要: 1.简介 ROC曲线与AUC面积均是用来衡量分类型模型准确度的工具。通俗点说,ROC与AUC是用来回答这样的问题的: 分类模型的预测到底准不准确? 我们建出模型的错误率有多大?正确率有多高? 两个不同的分类模型中,哪个更好用?哪个更准确? 一句话概括版本: ROC是一条线,如果我们选择用ROC曲线评 阅读全文

posted @ 2020-07-09 07:38 为主而活 阅读(1524) 评论(0) 推荐(0) 编辑

聚类效果评价指标

摘要: 1. ARI(Adjusted Rand Index) 兰德系数:聚类效果有一个评价指标。 这个指标不考虑你使用的聚类方法,把你的方法当做一个黑箱,只注重结果。可以说,是一个十分“功利”的指标。 在讲ARI之前呢,先讲述一下RI,也就是rand index,从两者的名字也可以看出来,这是ARI的祖宗 阅读全文

posted @ 2020-07-09 07:17 为主而活 阅读(3381) 评论(0) 推荐(0) 编辑

分类效果评价指标一混淆矩阵

摘要: 1.混淆矩阵:判断分类模型好坏 (摘自:版权声明:本文为CSDN博主「Orange_Spotty_Cat」的原创文章.原文链接:https://blog.csdn.net/Orange_Spotty_Cat/article/details/80520839) 混淆矩阵是ROC曲线绘制的基础,同时它也 阅读全文

posted @ 2020-07-09 07:15 为主而活 阅读(1325) 评论(0) 推荐(0) 编辑

2020年7月8日

关联规则与Apriori算法

摘要: 摘自:我是康小小 当我们去商店购物时,我们通常有一个标准的购物清单,每个购物的人都有一个独特的清单,取决于他们的需求和喜好,家庭主妇可能会为家庭晚餐购买健康的食材,而单身汉可能会购买啤酒和薯条。了解这些购物模式有助于通过多种方式提高销售额,如果有一对物品,X和Y经常被购买: X和Y都可以放在同一个架 阅读全文

posted @ 2020-07-08 06:47 为主而活 阅读(421) 评论(0) 推荐(0) 编辑

2020年7月6日

简单比较k-means和k-medoids

摘要: 简单对比一下这两者的区别。两者的主要区别主要在质心的选择中,k-means是样本点均值,k-medoids则是从样本点中选取。 首先给出两者的算法实现步骤: K-means 1、随机选取K个质心的值 2、计算各个点到质心的距离 3、将点的类划分为离他最近的质心,形成K个cluster 4、根据分类好 阅读全文

posted @ 2020-07-06 07:15 为主而活 阅读(2140) 评论(0) 推荐(0) 编辑

2020年7月5日

集成方法

摘要: 集成算法 1.是通过聚合多个分类器的预测来提高分类准确率。集成算法由训练数据构建一组基分类器,然后通过每个基分类器的预测进行投票来进行分类。 2.集成分类器的性能优于单个分类器必须满足两个条件: (1)基分类器必须是相互独立的。 (2)基分类器应当好于随机猜测分类器。 3.构建集成分离器的方法 (1 阅读全文

posted @ 2020-07-05 18:52 为主而活 阅读(582) 评论(0) 推荐(0) 编辑

BP神经网络模型

摘要: 1. BP神经网络模型(Backpropagation Neural Networks) 采用非线性激活函数,Sigmoid函数。 三个层次:输入层(Input Layer),隐藏层(Hidden Layer) 和输出层(Output layer),就好比神经网络的各个神经元具有不同功能一样。 输入 阅读全文

posted @ 2020-07-05 15:38 为主而活 阅读(6341) 评论(0) 推荐(0) 编辑

支持向量机-分类器之王

摘要: 1. 支持向量机(Support Vector Machine, SVM): 一种知名的二元线性/非线性分类方法,由俄罗斯的统计学家Vapnik等人所提出。它使用一个非线性转换(Nonlinear Transformation)将原始数据映像(Mapping)至较高维度的特征空间 (Feature 阅读全文

posted @ 2020-07-05 14:18 为主而活 阅读(483) 评论(0) 推荐(0) 编辑

逻辑回归

摘要: 1. 线性回归: 是预测模型,关键是要建立回归方程(自变量和因变量的函数关系)。这样就可以通过回归方程,每输入一个X的值,就能预测Y的值是多少。 2.逻辑回归(Logistic Regression): 是分类模型,是用于解决二分类(0 or 1)问题的机器学习方法,用于估计某种事物的可能性。是建立 阅读全文

posted @ 2020-07-05 08:25 为主而活 阅读(302) 评论(0) 推荐(0) 编辑

导航