模式识别与机器学习笔记
1.寻找数据中模式的问题是⼀个基本的问题
模式识别领域关注的是利⽤计算机算法⾃动发现数据中的规律,以及使⽤这些规律采取将数据分类等⾏动。
2.正确分类与训练集不同的新样本的能⼒叫做泛化(generalization)
输⼊向量的变化性是相当⼤的,以⾄于训练数据只所有可能的输⼊向量中相当⼩得⼀部分,
所以泛化是模式识别的⼀个中⼼问题
原始输⼊向量通常被预处理(pre-processed),变换到新的变量空间 预处理阶段有时被叫做特征抽取(feature extraction)
测试集必须使⽤与训练集相同的⽅法进⾏预处理。
3.反馈学习的⼀个通⽤的特征是探索(exploration)和利⽤(exploitation)的折中。
“探索”是指系统尝试新类型的动作,“利⽤”是指系统使⽤已知能产
⽣较⾼奖励的动作。过分地集中于探索或者利⽤都会产⽣较差的结果
4.⾃始⾄终在本书中使⽤的三个重要⼯具:概率论、决策论、信息论