电竞杰森斯坦森

2020年8月3日

摘要：总结随机森林 (以决策树为基学习器)：随机的体现数据集的随机选择：从原始数据集中采取有放回的抽样bagging，构造子数据集。不同子数据集的元素可以重复，同一个子数据集中的元素也可以重复待选特征的随机选取：随机森林中的子树的每一个分裂过程并未用到所有的待选特征，而是从所有的待选特征中随机选取阅读全文

posted @ 2020-08-03 17:07 电竞杰森斯坦森阅读(1065) 评论(0) 推荐(0) 编辑

11-机器学习-集成学习

摘要：总结集成学习：通过在数据上构建多个模型，考虑多个弱评估器的建模结果，汇总之后得到一个综合的结果，以此来获取比单个模型更好的回归或分类表现实现集成学习的方法 Bagging装袋法（有放回的抽样方法）：并行集成方法原理：每轮从原始样本集中使用有放回的方法抽取n个训练样本，共进行k轮抽取，得到k个训阅读全文

posted @ 2020-08-03 15:49 电竞杰森斯坦森阅读(167) 评论(0) 推荐(0) 编辑

2020年8月1日

10-机器学习-决策树、网格搜索调整参数

摘要：总结决策树 (有监督学习方法,集成学习的核心操作)：能够从一系列有特征和标签的数据中总结出决策（基于分类或者回归）规则，并用树状图的结构来呈现这些规则，以解决分类和回归问题 API: from sklearn.tree import DecisionTreeClassifier 节点：根节点（针对阅读全文

posted @ 2020-08-01 11:23 电竞杰森斯坦森阅读(3201) 评论(0) 推荐(1) 编辑

2020年7月30日

9-机器学习-支持向量机SVM

摘要：总结支持向量机SVM（支持向量网络，用于分类和预测）：很牛逼，最接近深度学习的机器学习算法支持向量机的原理超平面：超平面是当前空间的子空间，它是维度比所在空间小一维的空间决策边界：如果以一个超平面为界可以将一组数据集分成不同类别，那么这个超平面就是数据的决策边界（有很多条）决策边界的边际( 阅读全文

posted @ 2020-07-30 16:19 电竞杰森斯坦森阅读(373) 评论(0) 推荐(0) 编辑

2020年7月29日

8-9-机器学习-聚类算法-Kmeans

摘要：总结聚类：把没有类别的一组数据(原始数据没有分类)，根据样本与样本之间的相关性，分到已有的类别中（无监督学习）簇：KMeans算法将一组N个样本的特征矩阵X划分为K个无交集的簇（相当于是一个组）(簇的个数与质心相同质心：簇中所有数据的均值u通常被称为这个簇的“质心”（x求均值，y求均值，得到的阅读全文

posted @ 2020-07-29 23:35 电竞杰森斯坦森阅读(963) 评论(0) 推荐(0) 编辑

8-机器学习-逻辑回归项目案例

摘要：导入数据 import pandas as pd import matplotlib.pyplot as plt import numpy as np from pandas import DataFrame,Series %matplotlib inline states={'SeriousDlq 阅读全文

posted @ 2020-07-29 17:40 电竞杰森斯坦森阅读(547) 评论(0) 推荐(0) 编辑

2020年7月28日

1-1.计算机基础

摘要：一：python是一门编程语言 1. 什么是编程语言？什么语言？为什么要有编程语言？编程语言的本质就是一门语言语言就是一种事物与另外一种事物沟通的表达方式/工具人人类的语言 >奴隶人编程语言 >计算机 2. 什么编程？为什么要编程？编程就是人把自己想计算机做的事，也就是自己的思维逻辑，阅读全文

posted @ 2020-07-28 23:13 电竞杰森斯坦森阅读(156) 评论(0) 推荐(0) 编辑

7-机器学习-分类模型的评价指标

摘要：总结混淆矩阵先看正反，再看真伪准确率：Accuracy = (TP+TN)/(TP+FN+FP+TN) 预测正确的比例模型.score()方法返回的就是模型的准确率召回率：Recal = TP/(TP+FN) 就是TPR，真实正例被找到的概率 API:from sklearn.metric 阅读全文

posted @ 2020-07-28 18:43 电竞杰森斯坦森阅读(418) 评论(0) 推荐(0) 编辑

2020年7月27日

6-7-机器学习-逻辑斯蒂回归

摘要：总结逻辑回归 (对数几率回归)，是一种名为“回归”的线性分类器，其本质是由线性回归变化而来的，一种广泛使用于分类问题中的广义回归算法 (常用于二分类，但也可以用于多分类)。 API：from sklearn.linear_model import LogisticRegression Sigmoi 阅读全文

posted @ 2020-07-27 20:23 电竞杰森斯坦森阅读(533) 评论(0) 推荐(0) 编辑

6-机器学习-样本类别分布不均衡处理之过抽样和欠抽样

摘要：总结样本类别分布不均衡处理（处理过拟合和欠拟合问题）过抽样（上采样）：通过增加分类中少数类样本的数量来实现样本均衡 from imblearn.over_sampling import SMOTE 欠抽样（下采样）：通过减少分类中多数类样本的数量来实现样本均衡 (可能造成样本数据大量丢失) fr 阅读全文

posted @ 2020-07-27 18:19 电竞杰森斯坦森阅读(970) 评论(0) 推荐(0) 编辑

电竞杰森斯坦森

公告