上一页 1 2 3 4 5 6 7 ··· 9 下一页
摘要: 总结 随机森林 (以决策树为基学习器): 随机的体现 数据集的随机选择:从原始数据集中采取有放回的抽样bagging,构造子数据集。不同子数据集的元素可以重复,同一个子数据集中的元素也可以重复 待选特征的随机选取:随机森林中的子树的每一个分裂过程并未用到所有的待选特征,而是从所有的待选特征中随机选取 阅读全文
posted @ 2020-08-03 17:07 电竞杰森斯坦森 阅读(1065) 评论(0) 推荐(0) 编辑
摘要: 总结 集成学习:通过在数据上构建多个模型,考虑多个弱评估器的建模结果,汇总之后得到一个综合的结果,以此来获取比单个模型更好的回归或分类表现 实现集成学习的方法 Bagging装袋法(有放回的抽样方法):并行集成方法 原理:每轮从原始样本集中使用有放回的方法抽取n个训练样本,共进行k轮抽取,得到k个训 阅读全文
posted @ 2020-08-03 15:49 电竞杰森斯坦森 阅读(167) 评论(0) 推荐(0) 编辑
摘要: 总结 决策树 (有监督学习方法,集成学习的核心操作):能够从一系列有特征和标签的数据中总结出决策(基于分类或者回归)规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题 API: from sklearn.tree import DecisionTreeClassifier 节点:根节点(针对 阅读全文
posted @ 2020-08-01 11:23 电竞杰森斯坦森 阅读(3201) 评论(0) 推荐(1) 编辑
摘要: 总结 支持向量机SVM(支持向量网络,用于分类和预测):很牛逼,最接近深度学习的机器学习算法 支持向量机的原理 超平面:超平面是当前空间的子空间,它是维度比所在空间小一维的空间 决策边界:如果以一个超平面为界可以将一组数据集分成不同类别,那么这个超平面就是数据的决策边界(有很多条) 决策边界的边际( 阅读全文
posted @ 2020-07-30 16:19 电竞杰森斯坦森 阅读(373) 评论(0) 推荐(0) 编辑
摘要: 总结 聚类:把没有类别的一组数据(原始数据没有分类),根据样本与样本之间的相关性,分到已有的类别中(无监督学习) 簇:KMeans算法将一组N个样本的特征矩阵X划分为K个无交集的簇(相当于是一个组)(簇的个数与质心相同 质心:簇中所有数据的均值u通常被称为这个簇的“质心”(x求均值,y求均值,得到的 阅读全文
posted @ 2020-07-29 23:35 电竞杰森斯坦森 阅读(963) 评论(0) 推荐(0) 编辑
摘要: 导入数据 import pandas as pd import matplotlib.pyplot as plt import numpy as np from pandas import DataFrame,Series %matplotlib inline states={'SeriousDlq 阅读全文
posted @ 2020-07-29 17:40 电竞杰森斯坦森 阅读(547) 评论(0) 推荐(0) 编辑
摘要: 一:python是一门编程语言 1. 什么是编程语言?什么语言?为什么要有编程语言? 编程语言的本质就是一门语言 语言就是一种事物与另外一种事物沟通的表达方式/工具 人 人类的语言 >奴隶 人 编程语言 >计算机 2. 什么编程?为什么要编程? 编程就是人把自己想计算机做的事,也就是自己的思维逻辑, 阅读全文
posted @ 2020-07-28 23:13 电竞杰森斯坦森 阅读(156) 评论(0) 推荐(0) 编辑
摘要: 总结 混淆矩阵 先看正反,再看真伪 准确率:Accuracy = (TP+TN)/(TP+FN+FP+TN) 预测正确的比例 模型.score()方法返回的就是模型的准确率 召回率:Recal = TP/(TP+FN) 就是TPR,真实正例被找到的概率 API:from sklearn.metric 阅读全文
posted @ 2020-07-28 18:43 电竞杰森斯坦森 阅读(418) 评论(0) 推荐(0) 编辑
摘要: 总结 逻辑回归 (对数几率回归),是一种名为“回归”的线性分类器,其本质是由线性回归变化而来的,一种广泛使用于分类问题中的广义回归算法 (常用于二分类,但也可以用于多分类)。 API:from sklearn.linear_model import LogisticRegression Sigmoi 阅读全文
posted @ 2020-07-27 20:23 电竞杰森斯坦森 阅读(533) 评论(0) 推荐(0) 编辑
摘要: 总结 样本类别分布不均衡处理(处理过拟合和欠拟合问题) 过抽样(上采样):通过增加分类中少数类样本的数量来实现样本均衡 from imblearn.over_sampling import SMOTE 欠抽样(下采样):通过减少分类中多数类样本的数量来实现样本均衡 (可能造成样本数据大量丢失) fr 阅读全文
posted @ 2020-07-27 18:19 电竞杰森斯坦森 阅读(970) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 9 下一页