随笔分类 -  机器学习

摘要:Reference:李航 --《统计学习方法》 10 种主要的统计学习方法概括总结 方法 适用问题 模型特点 模型类型 学习策略 学习的损失函数 学习算法 感知机 二类分类 分离超平面 判别模型 极小化误分点到超平面距离 误分点到超平面距离 随机梯度下降 k 近邻 多类分类,回归 特征空间,样本点 阅读全文
posted @ 2020-07-06 14:15 -费费 阅读(865) 评论(0) 推荐(0) 编辑
摘要:向量范数 常用的几种为 0 范数、1 范数、2 范数、∞ 范数 0 范数 指得是向量中非 0 的元素个数 1 范数 各个元素的绝对值之和 2 范数 每个元素的平方和再开方 +∞ 范数 元素绝对值中的最大值 ∞ 范数 元素绝对值中的最小值 矩阵范数 常用的有 1 范数、2 范数、∞ 范数、F 范数 1 阅读全文
posted @ 2020-05-22 13:03 -费费 阅读(487) 评论(0) 推荐(0) 编辑
摘要:文本分类实现步骤: 1. 定义阶段:定义数据以及分类体系,具体分为哪些类别,需要哪些数据 2. 数据预处理:对文档做分词、去停用词等准备工作 3. 数据提取特征:对文档矩阵进行降维、提取训练集中最有用的特征 4. 模型训练阶段:选择具体的分类模型以及算法,训练出文本分类器 5. 评测阶段:在测试集上 阅读全文
posted @ 2020-05-14 23:26 -费费 阅读(3364) 评论(0) 推荐(0) 编辑
摘要:定义 :用于预测输入变量(自变量)和输出变量(因变量)之间的关系 简单来说,就是选择一条函数曲线使其能很好地拟合已知数据且很好地预测未知数据(预测值是连续的实数范围) 最常用的损失函数:平方损失函数 $$ L=\frac{1}{n}\sum_{i=0}^{n}{(wx^{(i)}+b y^{(i)} 阅读全文
posted @ 2020-03-07 20:45 -费费 阅读(165) 评论(0) 推荐(0) 编辑
摘要:机器学习按 学习方法 可分为:有监督(Supervised Learning)、无监督(Unsupervised Learning)、强化学习(Reinforcement Learning) 1. 有监督学习:数据集包含样本 x 与标签 y ,训练时,通过计算模型的预测值与真实标签 y 之间的误差来 阅读全文
posted @ 2020-03-05 12:50 -费费 阅读(712) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示