随笔分类 - Machine Learning
记录机器学习的相关技术、原理
摘要:机器学习中的评估指标 0 概述 使用机器学习方法为任务进行建模已变得很常见,主要应用在分类和回归两大任务体系中。 本节针对分类和回归任务,依次梳理出两个类任务中常见的模型性能评估指标 1 分类任务中的评估指标 1.1 混淆矩阵 混淆矩阵的列代表模型预测的标签,行表示样本实际的标签。二分类时候,如果将
阅读全文
摘要:1 概述 本文的主要目的是通过实现最简单的线性回归模型,理解pytorch在数据导入、模型定义、、损失计算、优化迭代、自动求导和批次训练等方面的特点。 2 数据导入 首先,生成真实的线性函数,参数为w和b;接着按照w和b的size来生成1000个样本数据 点击查看代码 import numpy as
阅读全文
摘要:K 近邻算法 算法情况解读 KNN算法的基本思想是物以类聚,人以群分,它是一种贪心算法,可以用于做分类/回归任务。KNN算法认为,距离相近的实例(instance)总是具有类似的性质x,这意味着它们会有相似的标签y。 KNN 基于训练集划分好实例的存储范围,KNN分类的时候就直接判断新的instan
阅读全文
摘要:references: https://ocw.nctu.edu.tw/course_detail-v.php?bgid=1&gid=1&nid=563 使用贝叶斯算法进行分类 1 基本解读 引例:银行对高危用户的识别,我们以伯努利分布的方式来记录银行高危用户,伯努利分布呢就是二项分布,如果用户是高
阅读全文
摘要:1 长度的定义 1.1 范式(Norm)与长度 范式是一个将数据从N维空间中映射到一维实数空间内的函数,范式是计算向量长度的规则,经由范式求解出的实数就是某一范式下对应的实数,它满足以下三个条件: 长度值大于等于0,当长度为0的时候,范式的输入x必定也为0 两变量和的范式小于等于两变量范式的和 数乘
阅读全文