随笔分类 -  模式识别与机器学习

摘要:基础概念 先验概率 根据先前的经验,也就是对某些类别预先知道的知识,对样本进行预测的概率。 似然概率 先验概率描述的根据现有知识,预测样本属于某一类的概率,是一个统计信息量。比如5个球中,有3个黑球,则黑球的概率是3/5。 似然概率描述的是已知样本属于某一类,预测样本特征x分布的概率。 后验概率 后 阅读全文
posted @ 2023-09-28 14:44 Laplace蒜子 阅读(20) 评论(0) 推荐(0) 编辑
摘要:硬间隔SVM 软间隔SVM 阅读全文
posted @ 2023-08-05 02:12 Laplace蒜子 阅读(8) 评论(0) 推荐(0) 编辑
摘要:神经网络基本概念 神经元基本结构 σ为激活函数,w为权重,x为输入,b为偏置项。 前馈全连接神经网络 ai(l)表示第l层第i个神经元的输出,向量a(l)表示第l层所有神经元的输出; wi,j(l)表示第l-1层第j个神经元到第l层第i个神经元之间连接权重。向量W(l)表示第l-1层神经元到第l层神 阅读全文
posted @ 2023-02-23 21:39 Laplace蒜子 阅读(98) 评论(0) 推荐(0) 编辑
摘要:1 线性回归简介 1.1 回归与分类的区别 若预测的值是离散值,如年龄,此类任务位“分类”。 若预测的值是连续值,如房价,此类任务为“回归”。 1.2 回归的目标 学习一个从输入X到输出Y的映射f,并根据该模型,对新的测试数据x进行预测,简单来说,就是找到一个输入与输出之间的映射,用于与新的输入。 阅读全文
posted @ 2023-02-18 22:18 Laplace蒜子 阅读(347) 评论(0) 推荐(0) 编辑
摘要:1 相关概念 1.1 半监督学习的定义 同时利用有标注数据和无标注数据学习 1.2 半监督分类/回归 给定标注数据和无标注数据,学习得到一个分类器f,要求该分类器f比只用标注数据学习得到的学习器更优。 1.3 半监督聚类/降维 给定标注数据,但是另外对数据做一些限制 聚类:两个点必须在一个簇,或两个 阅读全文
posted @ 2023-02-17 17:39 Laplace蒜子 阅读(608) 评论(0) 推荐(0) 编辑
摘要:集成学习 产生原因 已经开发了很多机器学习算法,单个模型的性能已经调到了最优,很难在改进。 基本框架 将多个弱学习器进行融合,通过样本加权,学习器加权,获得比单一学习器性能更加优越的强学习器。 Bagging(Bootstrap aggregating) Bootstrap采样 给定包含N个样本的数 阅读全文
posted @ 2023-02-08 21:09 Laplace蒜子 阅读(42) 评论(0) 推荐(0) 编辑
摘要:聚类的定义 聚类是一种非监督学习任务,其目的是发现数据中隐含的结构。 相似度度量 样本之间的相似性对聚类的结果很关键,在聚类的时候,是根据相似度来聚类的。 定义距离参数 非负性:两个样本之间的距离只能大于等于0; 可辨识性:样本只与自己的距离为0,与其他样本不会重叠; 对称性:样本a到样本b的距离等 阅读全文
posted @ 2023-02-06 11:05 Laplace蒜子 阅读(516) 评论(0) 推荐(0) 编辑
摘要:降维的定义 降维是将高维数据变成低维表示,同时数据中蕴含的信息尽量保持不变。(高维 —> 低维) 降维是一种非监督学习任务。因为降维过程中不用样本的标签。(非监督) 降维的必要性 有时候虽然原始输入是高维数据,但这些输入特征之间有冗余。其本质维度可能很低。 降维方式 PCA降维 基本思路 对原数据样 阅读全文
posted @ 2023-02-02 22:23 Laplace蒜子 阅读(251) 评论(0) 推荐(0) 编辑
摘要:1 相关概念 1.1 什么是模式? 可以被区分是否相似,存在于时间和空间中可观察的物体之中的信息。(模式不是事务本体,是从事物中获取的信息) 1.2 模式的直观特性 可观察性 可区分性 可相似性 1.3 人与机器的模式识别能力对比 模式识别对于人和动物及其平常,对计算机却非常困难。 1.4 模式识别 阅读全文
posted @ 2022-08-26 09:35 Laplace蒜子 编辑

点击右上角即可分享
微信分享提示