上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 26 下一页
摘要: 特征提取 将任意数据(如文本或图像)转换为可用于机器学习的数字特征 注:特征值化是为了计算机更好的去理解数据 特征提取分类: 字典特征提取(特征离散化) 文本特征提取 图像特征提取(深度学习将介绍) 字典特征提取 作用:对字典数据进行特征值化 sklearn.feature_extraction.D 阅读全文
posted @ 2021-02-01 22:42 夜月薇凉映银弩 阅读(93) 评论(0) 推荐(0) 编辑
摘要: 为什么要剪枝 •横轴表示在决策树创建过程中树的结点总数,纵轴表示决策树的预测精度。 •实线显示的是决策树在训练集上的精度,虚线显示的则是在一个独立的测试集上测量出来的精度。 •随着树的增长,在训练样集上的精度是单调上升的, 然而在独立的测试样例上测出的精度先上升后下降。 出现这种情况的原因: •原因 阅读全文
posted @ 2021-01-31 22:27 夜月薇凉映银弩 阅读(62) 评论(0) 推荐(0) 编辑
摘要: 决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-else结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法 决策树:是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果,本质是一颗由多个判断节点组成的树。 决策树分 阅读全文
posted @ 2021-01-30 21:59 夜月薇凉映银弩 阅读(319) 评论(0) 推荐(0) 编辑
摘要: 逻辑回归(Logistic Regression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归,但是它与回归之间有一定的联系。由于算法的简单和高效,在实际中应用非常广泛。 逻辑回归的原理 要想掌握逻辑回归,必须掌握两点: 逻辑回归中,其输入值是什么 如何判断逻辑回归的输出 阅读全文
posted @ 2021-01-29 21:44 夜月薇凉映银弩 阅读(146) 评论(0) 推荐(0) 编辑
摘要: sklearn模型的保存和加载API from sklearn.externals import joblib 保存:joblib.dump(estimator, 'test.pkl') 加载:estimator = joblib.load('test.pkl') 线性回归的模型保存加载案例 fro 阅读全文
posted @ 2021-01-28 22:18 夜月薇凉映银弩 阅读(658) 评论(0) 推荐(0) 编辑
摘要: 过拟合:一个假设在训练数据上能够获得比其他假设更好的拟合, 但是在测试数据集上却不能很好地拟合数据,此时认为这个假设出现了过拟合的现象。(模型过于复杂) 欠拟合:一个假设在训练数据上不能获得更好的拟合,并且在测试数据集上也不能很好地拟合数据,此时认为这个假设出现了欠拟合的现象。(模型过于简单) 欠拟 阅读全文
posted @ 2021-01-27 21:46 夜月薇凉映银弩 阅读(231) 评论(0) 推荐(0) 编辑
摘要: from sklearn.datasets import load_boston from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sk 阅读全文
posted @ 2021-01-26 21:59 夜月薇凉映银弩 阅读(92) 评论(0) 推荐(0) 编辑
摘要: 全梯度下降算法(Full gradient descent), 随机梯度下降算法(Stochastic gradient descent), 随机平均梯度下降算法(Stochastic average gradient descent) 小批量梯度下降算法(Mini-batch gradient d 阅读全文
posted @ 2021-01-25 21:22 夜月薇凉映银弩 阅读(210) 评论(0) 推荐(0) 编辑
摘要: 损失函数 总损失定义为: yi为第i个训练样本的真实值 h(xi)为第i个训练样本特征值组合预测函数 又称最小二乘法 正规方程 理解:X为特征值矩阵,y为目标值矩阵。直接求到最好的结果 缺点:当特征过多过复杂时,求解速度太慢并且得不到结果 其中y是真实值矩阵,X是特征值矩阵,w是权重矩阵 对其求解关 阅读全文
posted @ 2021-01-23 22:00 夜月薇凉映银弩 阅读(665) 评论(0) 推荐(0) 编辑
摘要: 线性回归 线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。 特点:只有一个自变量的情况称为单变量回归,多于一个自变量情况的叫做多元回归 线性关系 单变量线性关系: 多变量线性关系: 注释:单特征与目标值 阅读全文
posted @ 2021-01-22 22:11 夜月薇凉映银弩 阅读(533) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 26 下一页