bingmous

欢迎交流,不吝赐教~

导航

2019年11月22日 #

Bagging与随机森林

摘要: Bagging Bagging是并行式集成学习算法最著名的代表,基于自助采样法(bootstrap sampling)。 给定m个样本的数据集,选取m次,每次选1个样本,构成一个新的样本集,其中有的样本集在原始样本集中多次出现。约有63.2%存在与原始样本集。... 阅读全文

posted @ 2019-11-22 20:09 Bingmous 阅读(32) 评论(0) 推荐(0) 编辑

统计学习方法笔记

摘要: 目录 1 统计学习方法概论 2 感知机 3 k近邻法 4 朴素贝叶斯法 5 决策树——ID3,C4.5,CART 6 逻辑回归与最大熵模型 7 支持向量机——序列最小化SMO算法 8 提升方法——AdaBoost,提升树(分类,回归),梯度提升树(GBDT) ... 阅读全文

posted @ 2019-11-22 15:08 Bingmous 阅读(29) 评论(0) 推荐(0) 编辑

2019年11月15日 #

决策树CART回归树——算法实现

摘要: 决策树模型 选择最好的特征和特征的值进行数据集划分根据上面获得的结果创建决策树根据测试数据进行剪枝(默认没有数据的树分支被剪掉)对输入进行预测模型树 import numpy as npdef loadDataSet(fileName): #ge... 阅读全文

posted @ 2019-11-15 16:47 Bingmous 阅读(35) 评论(0) 推荐(0) 编辑

2019年11月14日 #

决策树——算法实现

摘要: 分类树,特征的值和类标签都是离散值 计算熵,选择最优分类特征对分类后的各个子集再进行计算熵,选择最优分类特征停止条件:分类后的所有数据集都属于同一类;没有可分的特征,选择数量最多的类作为预测类;import numpy as npimport mathimpo... 阅读全文

posted @ 2019-11-14 18:17 Bingmous 阅读(31) 评论(0) 推荐(0) 编辑

2019年11月12日 #

朴素贝叶斯——算法实现

摘要: 朴素贝叶斯通常用于特征的范围是离散的,即每个特征可取值的范围是离散的。给定训练集、标签,计算训练集中每个类标签的概率,再计算每个类标签下每个特征的概率。给出带预测样本的特征,计算每个类标签下的概率,选择最大的类标签作为预测类。 通常可以使用贝叶斯估计防止某个概... 阅读全文

posted @ 2019-11-12 12:45 Bingmous 阅读(42) 评论(0) 推荐(0) 编辑

2019年11月11日 #

numpy常用操作

摘要: 矩阵运算 * 表示按元素相乘@ 表示按矩阵相乘,或使用A.dot(B)使用不同类型的数组进行操作时,结果数组的类型应为更一般或更精确的类型(称为向上转换),数值型字符串传送给float64类型的数组时,类型会自动转换成float64。当建立一个np.array时,如果有字符串,有数字,数字会转换成字 阅读全文

posted @ 2019-11-11 12:13 Bingmous 阅读(33) 评论(0) 推荐(0) 编辑

2019年11月9日 #

k-NN——算法实现

摘要: k-NN 没有特别的训练过程,给定训练集,标签,k,计算待预测特征到训练集的所有距离,选取前k个距离最小的训练集,k个中标签最多的为预测标签 约会类型分类、手写数字识别分类 计算输入数据到每一个训练数据的距离选择前k个,判断其中类别最多的类作为预测类impor... 阅读全文

posted @ 2019-11-09 20:10 Bingmous 阅读(27) 评论(0) 推荐(0) 编辑

2019年11月7日 #

MySQL复制表结构

摘要: 复制表结构 1,使用LIKE + 表名 CREATE [TEMPORARY] TABLE [IF NOT EXISTS] tb2 LIKE tb1 2,使用AS + SELECT语句,AS可以省略 CREATE [TEMPORARY] TABLE [IF NO... 阅读全文

posted @ 2019-11-07 20:35 Bingmous 阅读(34) 评论(0) 推荐(0) 编辑

2019年11月5日 #

Ng ML笔记

摘要: 目录 一、线性回归 1,假设函数、代价函数,梯度下降 2,特征处理 3,代价函数和学习速率 4,特征和多项式回归 5,正规方程 二、逻辑回归(Logistic Regression,LR) 1,假设函数 2,代价函数 3,梯度下降算法 4,高级算法 三、正则化... 阅读全文

posted @ 2019-11-05 19:26 Bingmous 阅读(27) 评论(0) 推荐(0) 编辑

2019年10月20日 #

SQL Server笔记

摘要: 01 数据库一般用三层架构 sdata(源数据,临时表层),pdata(物理数据,经过一定的处理),pmart(市场库,可以用的数据) 建表 create table username (name varchar(100),age int,address va... 阅读全文

posted @ 2019-10-20 20:41 Bingmous 阅读(35) 评论(0) 推荐(0) 编辑