2017-2018-2 20179215 《密码与安全新技术》第六周作业
2017-2018-2 20179215 《密码与安全新技术》第六周作业
课程:《密码与安全新技术》
班级: 1792
姓名: 袁琳
学号:20179215
上课教师:谢四江
上课日期:2018年5月24日
必修/选修: 必修
学习内容总结
主要介绍了四个方面:
- 模式识别的概念
- 模式识别的主要方法
- 模式识别系统举例
- 模式识别系统的典型构成
一、模式识别的概念
两个常见的例子:
- 幼儿认动物
- 图书归类
用各种数学方法让计算机(软件与硬件)来实现人的模式识别能力,即用计算机实现人对各种事物或现象的分析、描述、判断、识别。
1.模式或者模式类:可以是研究对象的组成成分或影响因素之间存在的规律性关系,因素之间存在确定性或随机性规律的对象、过程或者事件的集合。
2.识别:对以前见过的对象的再认识。
3.模式识别:对模式的区分与认识,将待识别的对象根据其特征归并到若干类别中的某一类。
4.样本:所研究对象的一个一个个体, 通常有一组特征构成的向量来描述,也称样本向量。
5.样本集:若干样本的集合。
6.类或者类别:在样本集上定义的模式类子集合,同一类的样本在我们所关心的某种性质上是不可区分的,即具有相同的模式。
7.特征或者属性:描述样本的若干观测值。多个特征或属性构造特征向量或者属性向量,通常与样本向量混用。
模式识别也可以看成是从特征向量向类别所作的映射。
二、模式识别的主要方法
划分的原则:
- 问题的描述方式
- 问题或样本性质
- 理论基础
- 应用领域
1.按问题的描述方式划分
1)基于知识的模式识别方法
以专家系统为代表,根据人们已知的(从专家那里收集整理得到的)知识,整理出若干描述特征与类别间关系的准则,建立一定的计算机推理系统,再对未知样本决策其类别。
2)基于数据的模式识别方法
制定描述研究对象的描述特征,收集一定数量的已知样本作为训练集训练一个模式识别机器,再对未知样本预测其类别(主要研究内容)
2.问题或样本性质
1)监督模式识别(分类):先有一批已知样本作为训练集设计分类器,再判断新的样本类别(分类)
监督模式识别系统的典型框图:
2)非监督模式识别(聚类):只有一批样本,根据样本之间的相似性直接将样本集划分成若干类别(聚类)
非监督模式识别系统的典型框图:
3.处理监督模式识别问题的一般步骤:
(1)分析问题
- 针对具体的应用,分析是否可以转化成分类问题;
- 可能有那些类别;
- 已有的数据或者欲采集的数据中哪些因素或者特征与分类最具关联性。
(2)原始数据获取与预处理、特征形成
- 设计采集数据方式,获取原始数据,并进行预处理
- 从原始数据获取样本的原始特征
- 构造出已知样本集
(3)特征提取和选择
- 目的:从原始数据中,得到最能反映分类本质的特征
- 特征形成:通过各种手段从原始数据中得出反映分类问题的若干特征(有时需进行数据标准化)
- 特征选择:从特征中选取最有利于分类的若干特征
- 特征提取:通过某些数学变换,降低特征数目
(4)分类器设计
选定某一个分类器,用训练样本集对分类器进行训练,得到分类模型
(5)分类决策
- 利用一定方式对分类器进行性能评价
- 对未知样本经过观测、预处理、特征形成、特征提取与选择,构造特征向量,用已经设计好的分类器进行决策(预测);
- 必要时再根据问题的背景知识进行适当的后处理
4.非处理监督模式识别问题的一般步骤:
(1)分析问题:
- 针对具有的应用,分析是否可以转化成聚类问题;
- 可能或者希望得到的类别数;
- 已有的数据或者欲采集的数据中那些因素或者特征与聚类相关。
(2)原始数据获取与预处理、特征形成
- 设计采集数据方式,获取原始数据,并进行预处理
- 从原始数据获取样本的原始特征
- 构造出无类别标识的样本集(都是未知样本)
(3)特征提取和选择
为了更好地进行聚类,经常需要采用一定的算法对原始特征进行提取与选择。一般来说,针对聚类的提取与选择要比分类更困难
(4)聚类分析
选定某一个非监督模式识别方法,对样本集进行聚类分析。
(5)结果解释
- 考查聚类结果的性能;
- 分析聚类结果与研究问题之间的关系;
- 根据问题背景知识分析聚类结果的可靠性;
- 解释类的含义;
- 如果有新样本,可以采用就近原则进行进行分类。
5.理论基础
1)统计模式识别:概率论与数理统计
2)模糊模式识别:模糊逻辑
3)人工神经网络:神经科学、最优化、概率论与数理统计
4)结构模式识别:形式语言
6.应用领域
- 图象识别:染色体分类、遥感图象识别
- 文字识别:中外文印刷体、手写体识别
- 数字识别:0-9印刷体、手写体识别,典型例子:邮政手写数字识别
- 人脸识别
- 指纹识别
- 虹膜识别
- 掌纹识别
- 语音识别
三、模式识别系统举例
例1 不停车收费系统
交通部的收费标准:按吨位划分
收费站:按车型收费(间接按车辆设计载重量收费)
关键:车型的自动分类。几种主要技术:
1)提取车辆外形几何参数进行处理分析,实现分类。
如视频检测方法、红外检测方法。
2)测量车辆的其他物理参数(噪声、振动、压重等)实现分类。
如动态称重、电磁感应等。
3)直接识别车辆身份的方法实现分类。
如电子标签、视频牌照识别等。
例2 生物识别技术
根据每个人独有的可以采样和测量的生物学特征(生理特征)和行为学特征进行身份识别的技术。
-
指纹识别:最早、最成熟的识别技术。
-
掌纹识别:研究纹线上某几个点的幅值(灰度值)、线长
与线所对应的角之比等特征。
-
人脸识别
-
虹膜识别
-
签名识别
-
击键分析
四、模式识别系统的典型构成
模式识别系统的四个主要组成部分:
- 原始数据获取与预处理
- 特征提取和选择
- 分类或者聚类
- 后处理
五、贝叶斯决策理论
1.基于最小错误率的Bayes决策
利用概率论中的Bayes公式进行分类,可以得到错误率最小的分类规则。
2.基于最小风险的Bayes决策
在考虑各种错误能造成不同的损失的情况下的Bayes决策规则。
最小风险的Bayes决策的步骤:
1)在已知类先验概率和类概率密度函数的情况下,计算待识x的后验概率
2)根据决策表,计算每一个决策的条件风险
3)找出条件风险最小值所对应的决策,对x采取该决策(归属到该类)
学习中的问题和解决过程
人工智能在模式识别方面有哪些应用?
模式识别是人工智能研究的一个方向,主要是以计算机为媒介,采用数学技术的方法来实现模式的自动处理、判读。而这里所说的“模式”是指外界的环境和环境中所客观存在的客体,随着信息技术和人工智能研究的不断深入,人类对于复杂信息的处理有了一定的发展,但是这些研究尚处于初级阶段,
还需要我们继续不断的深入研究。当前计算机对外界环境( 文字、声音、人物等) 的识别是计算机模式识别的主要研究点。信息处理是人类根据环境的不同及情况来完成对信息的识别、判断,对于人类而言,主要信息来源是光学信息和声学信息,光学信息的采集主要是视觉器来获得,声学信息主要通过听觉器获得,而模式识别主要也是要让计算机能完成与人类相类似的信息采集。当前,市场上比较成熟的信息采集系统有光学字符识别系统( Optical Character Recognition) 、语音识别系统等。主要应用有:
(1)数字识别、汉字识别、语音识别
(2)基于模式识别的网络考试系统
(3)人脸立体模式识别
其他
模式识别技术是人工智能的基础技术,21世纪是智能化、信息化、计算化、网络化的世纪,在这个以数字计算为特征的世纪里,作为人工智能技术基础学科的模式识别技术,必将获得巨大的发展空间。在国际上,各大权威研究机构,各大公司都纷纷开始将模式识别技术作为公司的战略研发重点加以重视。参考资料:https://baike.baidu.com/tashuo/browse/content?id=5a65aebd46f9e220687643f7&lemmaId=&fromLemmaModule=pcBottom