[模式识别复习笔记] 第1-2章基本概念

1. 模式识别系统的各个设计环节

模式采集：借助物理设备（传感器、摄像头）进行数据的采集和存储。
预处理：数据清洗、降噪，增强数据中有用的信息。
特征提取：提取数据中对识别有用的特征。
分类器学习：根据训练数据特点，选择合适的分类器模型，利用训练集学习得到参数。

2. 模式识别的目标及原理

目标：寻找一种区分不同类的模式的“方法”，称为“分类方法”。给定一个新的模式，利用找到的分类方法将其分配给最接近的模式类。
思想：从过去的经验中学习。
训练集：搜集历史数据，用于观察数据中的规律。
特征提取：找出一种新的数据表示方法，使得规律易被发现。
分类器学习：学习规律的过程。
分类器：从训练集中学习到的规律的体现。
测试集：评估学习的规律而搜集的数据（通常和训练集不重合）。
预测：将规律应用到新模式上，得到预测结果。

3. 欠拟合、过拟合、泛化能力

欠拟合：模型复杂度过低或者训练数据特征过少，模型在训练集上就表现很差，不能对训练集中的实例进行正确分类，导致分类器泛化能力降低。

过拟合：模型复杂度过高，导致学习到了一些无用的特征，模型在训练集上的表现很好，但由于过分追求降低训练误差，导致分类器泛化能力降低。

泛化能力：训练好的分类器对 不在训练集中的新实例 正确分类的能力。

PS：泛化能力一般难以直接度量，通常会构建一个测试集，用分类器在测试集上的分类性能近似表示其泛化能力。

一个在训练集上取得好性能的分类器 不一定 具有好的泛化能力
一个在训练集上表现比较差的分类器 不可能 具有好的泛化能力。

4. 如何提高分类器的泛化性能

构建更好的训练数据集（数量多、多样性、无噪声、类别分布均衡）。
提高/降低模型的复杂度。

posted @ 2024-06-19 22:57 MarisaMagic 阅读(78) 评论(0) 收藏举报

刷新页面返回顶部