07 2020 档案

摘要:Yellowbrick可视化工具旨在指导模型选择过程。一般来说,模型选择是一个搜索问题,定义如下:给定N个由数值属性描述的实例和(可选)一个估计目标,找到一个由特征、算法和最适合数据的超参数组成的三元组描述的模型。在大多数情况下,“最佳”三元组是指收到模型类型的最佳交叉验证分数的三元组。 代码下载 阅读全文
posted @ 2020-07-25 11:36 落痕的寒假 阅读(100) 评论(0) 推荐(0) 编辑
摘要:聚类模型是试图检测未标记数据中模式的无监督方法。聚类算法主要有两类:聚集聚类将相似的数据点连接在一起,而质心聚类则试图在数据中找到中心或分区。Yellowbrick提供yellowbrick.cluster用于可视化和评估群集行为的模块。目前,我们提供了几种可视化工具来评估质心机制,特别是K均值聚类 阅读全文
posted @ 2020-07-25 11:16 落痕的寒假 阅读(128) 评论(0) 推荐(0) 编辑
摘要:回归模型试图预测连续空间中的目标。回归计分可视化工具显示模型空间中的实例,以便更好地理解模型是如何进行预测的。代码下载 Yellowbrick已经实施了三种回归评估: 残差图Residuals Plot:绘制期望值与实际值之间的差预测误差图Prediction Error Plot:在模型空间中绘制 阅读全文
posted @ 2020-07-25 10:49 落痕的寒假 阅读(72) 评论(0) 推荐(0) 编辑
摘要:目标可视化工具专门用于直观地描述用于监督建模的因变量,通常称为y目标。 代码下载 当前实现了以下可视化: 平衡箱可视化Balanced Binning:生成带有垂直线的直方图,垂直线显示推荐值点,以将数据装箱到均匀分布的箱中。类平衡Class Balance:可视化来检查目标,以显示每个类对最终估计 阅读全文
posted @ 2020-07-25 10:31 落痕的寒假 阅读(60) 评论(0) 推荐(0) 编辑
摘要:在本教程中,我们将查看各种Scikit Learn模型的分数,并使用Yellowbrick的可视化诊断工具对它们进行比较,以便为我们的数据选择最佳的模型。 代码下载 文章目录 1 使用说明1.1 模型选择三原则1.2 关于数据1.3 特征提取1.4 建模与评估1.4.1 评估分类器的通用指标1.4. 阅读全文
posted @ 2020-07-25 09:41 落痕的寒假 阅读(56) 评论(0) 推荐(0) 编辑
摘要:Yellowbrick是一个机器学习可视化库,主要依赖于sklearn机器学习库,能够提供多种机器学习算法的可视化,主要包括特征可视化,分类可视化,回归可视化,回归可视化,聚类可视化,模型选择可视化,目标可视化,文字可视化。本节主要介绍Yellowbrick如何快速使用。 代码下载 文章目录 1 使 阅读全文
posted @ 2020-07-25 09:06 落痕的寒假 阅读(89) 评论(0) 推荐(0) 编辑
摘要:特征选择 代码下载 本文主要介绍sklearn中进行特征选择的方法。 sklearn.feature_selection模块中的类可用于样本集的特征选择/降维,以提高估计量的准确性得分或提高其在超高维数据集上的性能。 文章目录 1 SelectFromModel基础使用2 SelectFromMod 阅读全文
posted @ 2020-07-09 22:17 落痕的寒假 阅读(259) 评论(0) 推荐(0) 编辑
摘要:特征选择 代码下载 本文主要介绍sklearn中进行特征选择的方法。 sklearn.feature_selection模块中的类可用于样本集的特征选择/降维,以提高估计量的准确性得分或提高其在超高维数据集上的性能。 文章目录 1 基本方法1.1 SelectKBest1.2 SelectPerce 阅读全文
posted @ 2020-07-09 22:07 落痕的寒假 阅读(125) 评论(0) 推荐(0) 编辑
摘要:特征选择 代码下载 本文主要介绍sklearn中进行特征选择的方法。 sklearn.feature_selection模块中的类可用于样本集的特征选择/降维,以提高估计量的准确性得分或提高其在超高维数据集上的性能。 文章目录 1 删除低方差的特征2 参考 # 多行输出 from IPython.c 阅读全文
posted @ 2020-07-09 21:46 落痕的寒假 阅读(97) 评论(0) 推荐(0) 编辑