摘要:目录 03 Java语言基础 基本数据类型 变量与常量 运算符 类型转换 代码规范 标识符命名规范 常用输入输出 04 流程控制 条件语句 循环语句 循环控制 练习 05 字符串 创建字符串 连接字符串 获取字符串信息 字符串操作 格式化字符串 使用正则表达式 字符串生成器 练习 06 数组 数组的
阅读全文
摘要:安装 https://www.eclipse.org/downloads/packages/ 中文版 https://www.eclipse.org/babel/downloads.php https://download.eclipse.org/techn...
阅读全文
摘要:Bagging Bagging是并行式集成学习算法最著名的代表,基于自助采样法(bootstrap sampling)。 给定m个样本的数据集,选取m次,每次选1个样本,构成一个新的样本集,其中有的样本集在原始样本集中多次出现。约有63.2%存在与原始样本集。...
阅读全文
摘要:目录 1 统计学习方法概论 2 感知机 3 k近邻法 4 朴素贝叶斯法 5 决策树——ID3,C4.5,CART 6 逻辑回归与最大熵模型 7 支持向量机——序列最小化SMO算法 8 提升方法——AdaBoost,提升树(分类,回归),梯度提升树(GBDT) ...
阅读全文
摘要:决策树模型 选择最好的特征和特征的值进行数据集划分根据上面获得的结果创建决策树根据测试数据进行剪枝(默认没有数据的树分支被剪掉)对输入进行预测模型树 import numpy as npdef loadDataSet(fileName): #ge...
阅读全文
摘要:分类树,特征的值和类标签都是离散值 计算熵,选择最优分类特征对分类后的各个子集再进行计算熵,选择最优分类特征停止条件:分类后的所有数据集都属于同一类;没有可分的特征,选择数量最多的类作为预测类;import numpy as npimport mathimpo...
阅读全文
摘要:朴素贝叶斯通常用于特征的范围是离散的,即每个特征可取值的范围是离散的。给定训练集、标签,计算训练集中每个类标签的概率,再计算每个类标签下每个特征的概率。给出带预测样本的特征,计算每个类标签下的概率,选择最大的类标签作为预测类。 通常可以使用贝叶斯估计防止某个概...
阅读全文
摘要:矩阵运算 * 表示按元素相乘@ 表示按矩阵相乘,或使用A.dot(B)使用不同类型的数组进行操作时,结果数组的类型应为更一般或更精确的类型(称为向上转换),数值型字符串传送给float64类型的数组时,类型会自动转换成float64。当建立一个np.array时,如果有字符串,有数字,数字会转换成字
阅读全文
摘要:k-NN 没有特别的训练过程,给定训练集,标签,k,计算待预测特征到训练集的所有距离,选取前k个距离最小的训练集,k个中标签最多的为预测标签 约会类型分类、手写数字识别分类 计算输入数据到每一个训练数据的距离选择前k个,判断其中类别最多的类作为预测类impor...
阅读全文
摘要:复制表结构 1,使用LIKE + 表名 CREATE [TEMPORARY] TABLE [IF NOT EXISTS] tb2 LIKE tb1 2,使用AS + SELECT语句,AS可以省略 CREATE [TEMPORARY] TABLE [IF NO...
阅读全文
摘要:目录 一、线性回归 1,假设函数、代价函数,梯度下降 2,特征处理 3,代价函数和学习速率 4,特征和多项式回归 5,正规方程 二、逻辑回归(Logistic Regression,LR) 1,假设函数 2,代价函数 3,梯度下降算法 4,高级算法 三、正则化...
阅读全文