Lv.的博客
摘要: 竞赛 阅读全文
posted @ 2019-08-19 16:38 Avatarx 阅读(507) 评论(0) 推荐(0) 编辑
摘要: https://www.cnblogs.com/Lin-Yi/p/10387648.html 为什么要做归一化或者标准化? 主要是为了调整样本数据每个维度的量纲,让每个维度数据量纲相同或接近。 为什么要调整量纲?目的是什么? 1 量纲不一样的情况是什么? 比如一个2分类任务,预测一批零件是合格品还是 阅读全文
posted @ 2019-08-19 16:37 Avatarx 阅读(1485) 评论(0) 推荐(1) 编辑
摘要: 关于标准化(standardization) 数据标准化能将原来的数据进行重新调整(一般也称为 z-score 规范化方法),以便他们具有标准正态分布的属性,即 μ=0 和 σ=1。其中,μ 表示平均值,σ 表示标准方差。数据标准化之后的形式可以按照如下公式进行计算: 如果我们是比较两个不同大小维度 阅读全文
posted @ 2019-08-19 16:35 Avatarx 阅读(1205) 评论(0) 推荐(0) 编辑
摘要: #数据标准化#StandardScaler (基于特征矩阵的列,将属性值转换至服从正态分布)#标准化是依照特征矩阵的列处理数据,其通过求z-score的方法,将样本的特征值转换到同一量纲下#常用与基于正态分布的算法,比如回归 #数据归一化#MinMaxScaler (区间缩放,基于最大最小值,将数据 阅读全文
posted @ 2019-08-19 16:29 Avatarx 阅读(2091) 评论(0) 推荐(0) 编辑
摘要: 案例: from sklearn import treefrom IPython.display import Imageimport pydotplusdot_data = tree.export_graphviz(model, out_file=None, filled=True, rounde 阅读全文
posted @ 2019-08-19 15:23 Avatarx 阅读(695) 评论(2) 推荐(0) 编辑
摘要: 前面的博客里有提到决策树,我们也了解了决策树的构建过程,如果可以可视化决策树,把决策树打印出来,对我们理解决策树的构建会有很大的帮助。这篇文章中,我们就来看下如何可视化输出一棵决策树。 一、安装相应的插件 我们需要安装Graphviz和pygraphviz,教程,这个教程里有详细的安装过程,这里就不 阅读全文
posted @ 2019-08-19 15:21 Avatarx 阅读(10483) 评论(0) 推荐(0) 编辑