随笔分类 - 数据分析与可视化
摘要:雷达图(也称为蜘蛛图或星形图)是一种可视化视图,用于使用一致的比例尺显示三个或更多维度上的多元数据。并非每个人都是雷达图的忠实拥护者,但我认为雷达图能够以视觉上吸引人的方式比较不同类别各个特征的值。本文主要讲述通过matplotlib绘制雷达图。本文所有代码见:Python-Study-Notes
阅读全文
摘要:Yellowbrick可视化工具旨在指导模型选择过程。一般来说,模型选择是一个搜索问题,定义如下:给定N个由数值属性描述的实例和(可选)一个估计目标,找到一个由特征、算法和最适合数据的超参数组成的三元组描述的模型。在大多数情况下,“最佳”三元组是指收到模型类型的最佳交叉验证分数的三元组。 代码下载
阅读全文
摘要:聚类模型是试图检测未标记数据中模式的无监督方法。聚类算法主要有两类:聚集聚类将相似的数据点连接在一起,而质心聚类则试图在数据中找到中心或分区。Yellowbrick提供yellowbrick.cluster用于可视化和评估群集行为的模块。目前,我们提供了几种可视化工具来评估质心机制,特别是K均值聚类
阅读全文
摘要:回归模型试图预测连续空间中的目标。回归计分可视化工具显示模型空间中的实例,以便更好地理解模型是如何进行预测的。代码下载 Yellowbrick已经实施了三种回归评估: 残差图Residuals Plot:绘制期望值与实际值之间的差预测误差图Prediction Error Plot:在模型空间中绘制
阅读全文
摘要:目标可视化工具专门用于直观地描述用于监督建模的因变量,通常称为y目标。 代码下载 当前实现了以下可视化: 平衡箱可视化Balanced Binning:生成带有垂直线的直方图,垂直线显示推荐值点,以将数据装箱到均匀分布的箱中。类平衡Class Balance:可视化来检查目标,以显示每个类对最终估计
阅读全文
摘要:在本教程中,我们将查看各种Scikit Learn模型的分数,并使用Yellowbrick的可视化诊断工具对它们进行比较,以便为我们的数据选择最佳的模型。 代码下载 文章目录 1 使用说明1.1 模型选择三原则1.2 关于数据1.3 特征提取1.4 建模与评估1.4.1 评估分类器的通用指标1.4.
阅读全文
摘要:Yellowbrick是一个机器学习可视化库,主要依赖于sklearn机器学习库,能够提供多种机器学习算法的可视化,主要包括特征可视化,分类可视化,回归可视化,回归可视化,聚类可视化,模型选择可视化,目标可视化,文字可视化。本节主要介绍Yellowbrick如何快速使用。 代码下载 文章目录 1 使
阅读全文
摘要:文章目录 1 安装2 快速入门2.1 基本用法2.2 输出图像格式2.3 图像style设置2.4 属性2.5 子图和聚类 3 实例4 如何进一步使用python graphviz Graphviz是一款能够自动排版的流程图绘图软件。python graphviz则是graphviz的python实
阅读全文
摘要:文章目录 通用教程简介(Introduction To ggplot2)4 ggplot2入门笔记4—前50个ggplot2可视化效果1 相关性(Correlation)1.1 散点图(Scatterplot)1.2 带边界的散点图(Scatterplot With Encircling)1.3 抖
阅读全文
摘要:文章目录 通用教程简介(Introduction To ggplot2)2 ggplot2入门笔记2—通用教程ggplot2简介1. 了解ggplot语法(Understanding the ggplot Syntax)2. 如何制作一个简单的散点图(How to Make a Simple Sca
阅读全文
摘要:文章目录 1 ggplot2入门笔记1—ggplot2简要教程1. 设置 The Setup2. 图层 The Layers3. 标签 The Labels4. 主题 The Theme5. 分面 The Facets6. 常用函数 Commonly Used Features6.1 绘制时间序列图
阅读全文
摘要:文章目录 wgcna入门-雌性小鼠肝脏表达数据的网络分析:寻找与体重有关的模块 1 数据输入和清洗 1.1 加载基因表达数据 1.2 数据清洗 1.3 加载临床特征数据 2 建设表达网络与模块检测 2.1 自动一步构建网络与模块检测 2.1.1 软阈值的选择:网络拓扑分析 2.1.2 一步构建网络与
阅读全文
摘要:文章目录 VENN DIAGRAM(维恩图)1. 具有2个分组的基本的维恩图 Venn diagram with 2 groups2. 具有3个组的基本维恩图 Venn diagram with 3 groups3. 自定义维恩图 Custom Venn diagram4. 精致的维恩图 Elabo
阅读全文
摘要:文章目录 NetworkX实例1. 基础Basic2. 绘图Drawing3. 图标Graph NetworkX实例 代码下载地址 NetworkX 2.4版本的通用示例性示例。本教程介绍了约定和基本的图形操作。具体章节内容如下: 基础Basic绘图Drawing图标Graph 本文参考: http
阅读全文
摘要:R语言PCA分析教程 Principal Component Methods in R(代码下载) 主成分分析Principal Component Methods(PCA)允许我们总结和可视化包含由多个相互关联的定量变量描述的个体/观察的数据集中的信息。每个变量都可以视为不同的维度。如果数据集中包
阅读全文
摘要:文章目录 12 绘图实例(4) Drawing example(4)1. Scatterplot with varying point sizes and hues(relplot)2. Scatterplot with categorical variables(swarmplot)3. Scat
阅读全文
摘要:文章目录 10 绘图实例(2) Drawing example(2)1. Grouped violinplots with split violins(violinplot)2. Annotated heatmaps(heatmap)3. Hexbin plot with marginal dist
阅读全文
摘要:文章目录 9 绘图实例(1) Drawing example(1)1. Anscombe’s quartet(lmplot)2. Color palette choices(barplot)3. Different cubehelix palettes(kdeplot)4. Distribution
阅读全文
摘要:seaborn学习笔记章节 seaborn是一个基于matplotlib的Python数据可视化库。seaborn是matplotlib的高级封装,可以绘制有吸引力且信息丰富的统计图形。相对于matplotlib,seaborn语法更简洁,两者关系类似于numpy和pandas之间的关系,seabo
阅读全文
摘要:文章目录 5 小提琴图Violinplot1. 基础小提琴图绘制 Basic violinplot2. 小提琴图样式自定义 Custom seaborn violinplot3. 小提琴图颜色自定义 Control color of seaborn violinplot4. 分组小提琴图 Group
阅读全文