03 2024 档案
摘要:1.模型理念 解决分类问题的目标是,根据现有数据获得一个分类器,当出现新数据后代入分类器,得到新数据属于哪个类别;而所谓的回归:其本来应该在什么位置,实际案例中可能会有所偏离,但是随着趋势的进行,其结果不会一直偏离下去而是会在原本应该的位置上下抖动。对这类回归问题的研究方法是:根据现有的观测数据,找
阅读全文
摘要:1.数据特征的归一化 1.1 问题产生 当样本不同特征数据的数值范围相差过大,目标函数会变得很扁,在梯度下降的时候,梯度方向会在一定程度上偏离极值点方向,降低了训练效率,增大了训练时间。有些训练数据的值很大,很容易超出数值范围,不利于运算。 1.2 归一化方法 通过归一化来解决上述问题,即:去量纲化
阅读全文
摘要:1. ML基本认识 机器学习是研究AI的一种方法。其从数据中挖掘特征从而学习到一些规律、规则(模型),然后对输入的新数据做出 预测(回归)和判断(分类)。 机器学习主要分为: 有监督学习:数据有标签,有监督学习分为 分类&回归 两类问题。 无监督学习:数据无标签,如:聚类等。 半监督学习:人工标注是
阅读全文
摘要:1.4.1 现象和问与答 遇到无法用传统概率学方法来解决一些现实问题,如:多维度空间点分类。可以用ML领域的一些方法,事先建立模型,将 距离d =》概率P,用模型计算点属于哪一类的概率。 那对于新问题如何确定模型呢? 进行随机样本实验,根据实验结果,反推模型参数。 现在有了实验数据,如何通过实验数据
阅读全文
摘要:1.3.1 优化初步了解 逐步逼近解析解的过程。在实际问题当中,很多都是没有完全正确的解析解的,但是可以有数值解。(在我们接受的误差范围内,足够接近解析解的近似值。) 1.3.2 优化理论 - 最小二乘法 即:最小平方误差法。例:测量一物体长度,多次测量得到不同测量值(数值解),如何最精确的确定物体
阅读全文
摘要:1.2.1 概率认识 a)什么是概率:通俗的讲,概率就是 随机事件发生的可能性大小。 b)概率的公理化定义:设随机试验的样本空间Ω,若按照某种方法,对样本空间中的每一个事件 A 都赋予一个实数值 P(A),且符合以下性质: 1)非负性:P(A) ≥ 0 2)规范性:P(Ω) = 1 3)(无限)可列
阅读全文
摘要:1.获取流的方法: // 1.从集合转化 List<Integer> list = new ArrayList<>(); Stream<Integer> stream = list.stream();// 转化为流 stream.Collect(Collectors.toList());//转换为流
阅读全文