数字视频图像处理与通信教学作者刘富强王新红宋春林陈康力第8章节课件

上传人:w****i 文档编号:91939675 上传时间:2019-07-04 格式:PPT 页数:83 大小:2.74MB
返回 下载 相关 举报
数字视频图像处理与通信教学作者刘富强王新红宋春林陈康力第8章节课件_第1页
第1页 / 共83页
数字视频图像处理与通信教学作者刘富强王新红宋春林陈康力第8章节课件_第2页
第2页 / 共83页
数字视频图像处理与通信教学作者刘富强王新红宋春林陈康力第8章节课件_第3页
第3页 / 共83页
数字视频图像处理与通信教学作者刘富强王新红宋春林陈康力第8章节课件_第4页
第4页 / 共83页
数字视频图像处理与通信教学作者刘富强王新红宋春林陈康力第8章节课件_第5页
第5页 / 共83页
点击查看更多>>
资源描述

《数字视频图像处理与通信教学作者刘富强王新红宋春林陈康力第8章节课件》由会员分享,可在线阅读,更多相关《数字视频图像处理与通信教学作者刘富强王新红宋春林陈康力第8章节课件(83页珍藏版)》请在金锄头文库上搜索。

1、第8章 图像识别,目录,8.1 图像识别的基本概念 8.2 基于匹配的识别技术 8.3 统计识别方法 8.4 人工神经网络识别法 8.5 支持向量机识别方法,8.1 图像识别的基本概念,“模式识别”是外部信息被感官接收并被转换成有意义的感觉经验的过程。,图8-1 模式识别系统图,8.2 基于匹配的识别技术,8.2.1 图像变换 1.刚体变换 变换公式为: (8-1) 其中 为旋转角, 为平移向量。 2.仿射变换 变换公式为: (8-2),8.2.1 图像变换(续),3.投影变换 变换公式为: (8-3) 4.非线性变换 函数表达式为 (8-4) (8-5a) (8-5b),8.2.2 相似性测

2、度,1.互相关相似性测度 假设模板为T,被搜索的基准图为S,模板T在S上移动,覆盖的子区域为,i和j是子区域的左上角像素在基准图中的坐标,则归一化互相关相似性测度为: (8-7),2.基于傅里叶分析的测度,图像的傅里叶变换由实部和虚部组成: (8-9) 这也可以表示为: (8-10) (8-11) 计算两幅图像的互功率谱就可以得到两幅图像的角度差别: (8-12),8.2.3 插值算法,现实世界中的图像是个模拟信号 ,数字图像是对其采样而形成的离散信号 ,恢复成连续函数只需要用一个理想低通滤波器对其滤波,空间域上就表现为与Sinc函数的卷积。用tri函数对Sinc函数逼近 (8-13),8.2

3、.4 最小二乘法,以6个参数的仿射变换为例:,可以证明,只要W的秩大于6,则存在A和B的最小二乘解:,8.3 统计识别方法,统计模式识别是对模式的统计分类方法,它首先将被识别的对象数字化,以变换为适合计算机处理的数字信息。然后进行特征提取,并将输入模式从对象空间映射到特征空间。此阶段得到的特征向量被定义在一个特征空间中,这个空间包含了所有的特征向量,不同的特征向量,或者说不同类别的对象都应用于空间中的一点,即模式可用特征空间中的一个点或一个特征矢量表示。这种映射不仅压缩了信息量,而且易于分类。在分类阶段,则利用决策系统对特征空间进行划分,从而达到识别不同特征对象的目的。,8.3.1线性决策函数

4、,早在20世纪30年代,费希尔在研究3种不同类型的鸢尾属植物的花(Setosa、Virginica和Versicolor)时,就采用线性决策函数方法来对花朵进行识别。 做法:通过测量花瓣的宽度和高度,并用这两个度量来作为描述子而生成二维矢量模式。,鸢尾属花瓣的二维矢量模式空间,分析,当将Virginica和Versicolor归并为同一模式时,用一条直线可以很容易地将Setosa类(即 模式)和非Setosa类(即 模式)分割开来。此时线性决策函数为直线方程: 其中, 为二位特征; 为全参数。 属于 类的任意模式 ,代入 后将得到正值; 属于 类的任意模式 ,代入 后将得到负值。,分析,二维模

5、式的决策函数利用了数学上的线性规则方法,下面将其推广到n维的情况,最终得到的一般线性决策函数的表达式为:,分析,为了方便起见,在所有特征向量的最末元素后面再附加元素1,则上式可改写为: 其中: 称为增广式, 称为增广权向量,由于附加的模式都增加相同的量,所以不影响模式类别的基本几何特征。,分析,对于两类的情况,决策函数 有以下性质: 当 时为两类的决策边界。当特征向量 的维数n=2时,决策边界为一直线,当 n=3时,决策边界为平面;n3 时,决策边界为一超平面。,多类别问题,对于多类别问题,模式有 个类别。下面分三种情况讨论。 第一种情况:每一类模式与其他类模式可用单个决策面分割。设 M 类模

6、式,有 M 个决策函数,具有以下的性质:,其中, 是第i 个决策函数的权向量。,第一种情况的多类决策函数,由图可知,3个决策函数 、 、 将平面分成了7个区域。当存在模式 ,若欲对其进行判别分类,只需将其代入决策函数。若满足 、 、 则它属于 模式;若满足 、 、 则它属于 模式;若满足 、 且 则它属于 模式;若判断条件无法满足上面任何一种模式,则它属于不确定区域。,第一种情况的多类决策函数,第二种情况的多类决策函数,第二种情况的多类决策函数,当存在模式 ,对其进行类别分类。那么若满足条件 , 则它属于 模式;若满足条件 , 则它属于 模式;若满足条件 , 则它属于 模式;弱判断条件无法满足

7、上面任何一种模式,则它属于不确定区域。,第三种情况的多类决策函数,第三种情况的多类决策函数,设存在 个决策函数,其形式为 , 。若 ,那么 ,且 。这就是说,要判别模式X属于哪一类,现将X 代入 个决策函数中,决策函数最大的那个类别就是X所属类别。,基于三维特征的决策分类,基于三维特征的决策分类,在一个笛卡尔坐标系中,3个坐标轴分别描述了3个特征分量,当存在模式 和模式 时,可以用一个平面将两个模式进行分类。,8.3.2最小距离分类器,假设已知样本有 类模式,即 。那么原形模式 可以定义为该类模式的平均矢量,这里 是类 的模式矢量数目:,那么任意模式向量与第 个原型模式之间的欧几里德 距离为:

8、,欧几里德距离的决策函数表示,将上式两边同时取平方得:,的最小值等价于选择 的最小值。当 取得最大值时, 将取得最小值。故决策函数为,决策函数(续),在 得出最大数值时将 划归给类 ,且类 和 之间的最小距离分类器的决策边界是:,由上式给出的决策边界是连接 和 线段的中垂线。可见在二维情况下,决策边界是一条线。此外很容易想象在三维情况下,决策边界将会是一个平面。对于大于三维的情况,决策边界将会是一个超平面。,8.4人工神经网络识别法,人工神经网络是一种近几十年来兴起的一项新技术。它的应用非常广泛,包括了交通监管、实时控制、模式识别等领域。 人工神经网络的工作方式类似于人脑,其基本组成单元也被称

9、为“神经元”,所以神经网络可以说是对人脑工作方式的一种初级的模拟。 虽然人工神经网络仅仅是对人脑机能的初级模拟,但是它却具备了类似于人脑一样解决复杂问题的能力,而且对复杂的外部环境也有较好的适应性。 对于难以用数学模型精确描述的系统,人工神经网络是不错的选择方向。,人工神经网络概念,人工神经网络四个基本特征: (1)非线性 人工神经元处于激活或抑制二种不同的状态,这种行为在数学上表现为一种非线性关系。 (2)非局限性 一个系统的整体行为不仅取决于单个神经元特征,而且可能主要由单元之间的相互作用、相互连接所决定。 (3)非常定性 神经网络不但处理的信息可以有各种变化,而且在处理信息的同时,非线性

10、动力系统本身也在不断变化。 (4)非凸性 一个系统的演化方向,在一定条件下将取决于某个特定的状态函数。,8.4.2 BP神经网络,BP网络模型已成功用于信号处理、文本与语音变换和数据处理。BP网络虽然具有很强的非线性映射能力,有广泛的应用,但它也有许多缺点: (1)学习收敛速度慢; (2)容易陷入局部最小 ; (3)网络的学习、记忆具有不稳定性。 为了克服上述的缺点,提高BP网络的性能,人们也提出了许多改进方案。,BP神经元模型,右图给出了一个基本的BP神经元,它有n个输入,每个输入都通过一个适当的权值 ,i=1,2,连接到神经元节点上,其中输出函数 , ,a作为激活函数f的输入。激活函数的另

11、一个输入是神经元的阈值。,权值和输入矩阵可写成,神经元模型的输出向量可表示为,BP网络的单个神经元模型,激活函数的另一个输入分量为阈值(偏差),在网络的设计中(阈值)偏差起着重要的作用,它似的激活函数的图形可以左右移动而增加了解决问题的可能性。因此,也可以将阈值作为一个权值,将其输入设为固定常数1(即令 =1)。为了在网络设计中方便起见,前面图可改为下图)。,(a)激活函数单独表示(b)激活函数隐含在神经元模型中,BP网络结构,(1)单隐层BP网络 BP网络通常有一个或多个隐层,隐层中的神经元均采用S型激活函数,输出层神经元采用线性传递函数,如果BP网络的最后一层采用S型激活函数,那么整个网络

12、的输出就被限制在一个较小的范围内;如果BP网络的最后一层采用线性激活函数,那么整个网络的输出可以取任意值,具有一个隐层的BP网络,双隐层BP网络,具有两个隐层的BP网络,分析1,设输入向量为n+1维,其中 为第一隐层中激活函数的阈值,将其增光到输入量中,作为一个分量 ,即 , ,输入量 可以是离散量0,1或-1,1,也可以是连续量;网络含有两个隐层,设第一隐层有 个神经元,于是该层的输出向量 , ,第二隐层有 个神经元,其输出向量 , ;输出层有m个神经元,于是网络的输出量 ,,分析2,第一隐层和第二隐层神经元均采用S型对数激活函数,输出神经元采用线性激活函数。网络中各层神经元的输出为:,为了

13、方便讨论,将神经元的阈值视为连接权来处理,即 , , 于是上式写为如下形式,BP学习算法,BP算法通常应用最速下降法。,工作信号(用实线表示),它是施加输入信号后向前传播知道在输出端产生实际输出的信号,它是输入和权值的函数。 误差信号(用虚线表示),实际输出与应有输出之间的差值即为误差,它由输出端开始逐层向后传播。,分析,网络的信号传送是由两部分组成,即正向传播与反向传播,在正向传播阶段,学习样本送入传输层,经隐层逐层运算后,传至输出层,每一层神经元的状态只影响下一层神经元,如果在输出层没有得到期望的输出结果,即网络的实际输出与期望输出之间存在误差,则计算输出层的误差变化值,然后输入误差反向传

14、播阶段,这是误差信号沿着原来的连接西欧那个输出层返回至输入层,并逐层调整连接权值,以使误差达到最小。 由于输出层对产生误差的调整,首先必须通过改变隐层与输出层之间的连接权来实现,而隐层要能对输出层反传过来的误差,也须调整前一隐层(或输入层)与它之间的连接权值,如此进行下去,这就是BP网络学习过程的一个重要特点。,BP网络权值的调整原理,以多层前反馈网络为例,进行BP算法的推导。设输入的学习样本有个: ,对应的教师信号(即输出的期望值)为 。在此用这个样本对 ,p=1,2,对网格进行训练。当第p个样本对输入到网络后,正向传播阶段经各层运算,网络的实际输出值 ,l=1,2,m。将其与期望值相比较,可在第p个输入模式后输出方差为,若输入所有个样本对经正向传递运算后,则网络的总误差为,BP网络权值的调整原理(续),应用最速下降法,反向调整各层连接权值,使误差达到最小。设 为网络任意两个神经元之间的连接权,沿负梯度方向调整连接权 的修正量为,设n为迭代次数,应用梯度法可得网络各层连接权的迭代关系式为,逐层反向传播的调整规律,第二隐层至输出层的连接权修正量为,令上式中,故可改写为,式中, 为学习速度,其值通常在0.011.0之间, 为输出神经元的实际误差; 为在第p个输入样本对作用下,输出神经元l的等效误差,即,逐层反向传播的调整规律(续

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号