多媒体技术应用 普通高等教育十一五 国家级规划教材 教学课件 PPT 作者 赵士滨 YDMT14

上传人:w****i 文档编号:94482419 上传时间:2019-08-07 格式:PPT 页数:21 大小:403.50KB
返回 下载 相关 举报
多媒体技术应用 普通高等教育十一五 国家级规划教材 教学课件 PPT 作者 赵士滨 YDMT14_第1页
第1页 / 共21页
多媒体技术应用 普通高等教育十一五 国家级规划教材 教学课件 PPT 作者 赵士滨 YDMT14_第2页
第2页 / 共21页
多媒体技术应用 普通高等教育十一五 国家级规划教材 教学课件 PPT 作者 赵士滨 YDMT14_第3页
第3页 / 共21页
多媒体技术应用 普通高等教育十一五 国家级规划教材 教学课件 PPT 作者 赵士滨 YDMT14_第4页
第4页 / 共21页
多媒体技术应用 普通高等教育十一五 国家级规划教材 教学课件 PPT 作者 赵士滨 YDMT14_第5页
第5页 / 共21页
点击查看更多>>
资源描述

《多媒体技术应用 普通高等教育十一五 国家级规划教材 教学课件 PPT 作者 赵士滨 YDMT14》由会员分享,可在线阅读,更多相关《多媒体技术应用 普通高等教育十一五 国家级规划教材 教学课件 PPT 作者 赵士滨 YDMT14(21页珍藏版)》请在金锄头文库上搜索。

1、第十四章 多媒体识别技术,多媒体识别和机器视觉 文字识别的基本原理 声音识别的基本原理 图像识别的基本原理 生物特征的辨别与验证,常用的多媒体特征识别类型 1.指纹识别(fingerprinting) 2.虹膜识别 3.视网膜识别 4.面部识别 5.手掌几何学识别 6.声音识别 7.签字识别 8.文字识别,多媒体识别和机器视觉,几类生物识别特点的比较,多媒体识别和机器视觉,特征识别技术的测量因子 1. 拒假率(FRR) 在获取一个对像的特征信息进行生物测量时,所得结果与该对像已经记录在多媒体数据库中的模板不匹配,称为拒假事件。拒假事件的发生概率或者实际发生的频率就是拒假率。 2. 容假率(FA

2、R) 对一个对象的特征采样取得的数据与多媒体数据库中另外一个非该对象的模板足够相似,以至于匹配,这种误认称为接受假事件,相关的概率叫做容假率FAR。,多媒体识别和机器视觉,多媒体识别技术的1:1与1:N方法 1:1技术 1:1技术可概括为:“是我吗?”1:1技术是一个验证过程,是通过把一个现场采集到的特征与一个已经登记的特征进行一对一的比对,以确认身份的过程,验证是否是对应的对像。 1:N技术 1:N技术可概括为:“我是谁” 1:N技术是一个辨识过程,是把现场采集到的特征同特征数据库中的特征逐一进行匹配,从中找出与现场特征相匹配的库内数据。这也叫“一对多匹配“。,多媒体识别和机器视觉,几种识别

3、方法的误接受率和安全等级,多媒体识别和机器视觉,机器视觉的概念和原理 机器视觉就是用各种成像系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。机器视觉的最终研究目标就是使机器能像人那样通过视觉观察和理解世界,具有自主适应环境的能力。 机器视觉系统通过图像摄取装置(分 CMOS 和 CCD 两种)将被摄取目标转换成图像信号,传送给专用的图像处理系统,根据像素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场的设备动作。,多媒体识别和机器视觉,机器视觉系统的构成 1.照明 2.镜头 3.相机 4.图像采集卡 5.

4、视觉处理器,多媒体识别和机器视觉,光学字符识别OCR 光学字符识别OCR(Optical Character Recognition)技术,是指使用扫描仪或数码相机等电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,也是对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。 OCR的工作原理 图像输入:要辨识处理的对像须通过光学仪器,如图像扫描仪、传真机或摄影器材,将图像转入计算机。 图像前处理:包含了图像正规化、去除噪声、图像矫正等的图像处理,及图文分析、文字行与字分离的文件前处理。,文字识别的基本原理,OCR的工

5、作原理 文字特征抽取:是 OCR的核心,特征抽取的区分可分为两类, 一是统计的特征,如文字区域内的黑、白点数比,当文字区分成好几个区域时,这一个个区域黑、白点数比之联合,就成了空间的一个数值向量,在比对时,基本的数学理论就能完成。 另一类特征为结构的特征,如文字图像细线化后,取得字的笔划端点、交叉点之数量及位置,或以笔划段为特征,配合特殊的比对方法,进行比对,线上手写输入软件的识别方法多以这种结构的方法为主。 对比数据库:数据库的内容应包含所有欲识别的字集文字,根据与输入文字一样的特征抽取方法所得的特征群组。,文字识别的基本原理,OCR的工作原理 对比识别:对比识别是运用数学运算理论的模块,根

6、据不同的特征特性,选用不同的数学距离函数,利用各种特征比对方法的相异互补性,使识别出的结果更好。 字词后处理:用户利用比对后的识别文字与其可能的相似候选字群中,根据前后的识别文字找出最合乎逻辑的词,做更正的功能。 字词数据库:为字词后处理所建立的词库。 人工校正:一个好的OCR软件,除了有稳定的图像处理及识别核心,以降低错误率外,人工校正的操作流程及其功能,亦影响OCR的处理效率。 结果输出:因用户的使用目的而异 。,文字识别的基本原理,语音识别技术 主要包括特征提取、模型训练和模式匹配准则3个方面,另外还涉及到语音识别单元的选取技术。 声学特征 声学特征的提取与选择是语音识别的一个重要环节。

7、 语音识别系统的模型 语音识别系统的模型通常由声学模型和语言模型两部分组成,分别对应于语音到音节概率的计算和音节到字概率的计算。,声音识别的基本原理,语音识别系统的模型 声学模型 HMM声学建模:马尔可夫模型的概念是一个离散时域有限状态自动机 ,HMM通常是用从左向右单向、带自环、带跨越的拓扑结构来对识别基元建模。 上下文相关建模:英语的上下文相关建模通常以音素为基元,由于有些音素对其后音素的影响是相似的,因而可以通过音素解码状态的聚类进行模型参数的共享。 语言模型 语言模型主要分为规则模型和统计模型两种。统计语言模型是用概率统计的方法来揭示语言单位内在的统计规律,其中N-Gram模型被广泛使

8、用。,声音识别的基本原理,图像识别是以图像的主要特征为基础的。对图像识别时眼动的研究表明,视线总是集中在图像的主要特征上,也就是集中在图像轮廓曲度最大或轮廓方向突然改变的地方,这些地方的信息量最大。 图像识别模型 模板匹配模型 :识别某个图像,必须在过去的经验中有这个图像的记忆模式,又叫模板。当前的刺激如果能与大脑中的模板相匹配,这个图像也就被识别了。 原型匹配模型 :这种模型认为,在长时记忆中存储的并不是所要识别的无数个模板,而是图像的某些“相似性”。从图像中抽象出来的“相似性”就可作为原型,拿它来检验所要识别的图像。如果能找到一个相似的原型,这个图像也就被识别了。,图像识别的原理,人脸识别

9、技术 人脸识技术广泛采用区域特征分析算法,它融合了计算机多媒体技术、图像处理技术与生物统计学原理于一体,利用计算机多媒体技术从视频中提取人像特征点,利用生物统计学的原理进行分析建立数学模型,即人脸特征模板。利用已建成的人脸特征模板与被测者的人的面像进行特征分析,根据分析的结果来给出一个相似值。通过这个值即可确定是否为同一人。 人脸侦测的步骤 影像输入-关键页面取得-肤色分析-影像二值化-杂讯处理-边缘侦测-水平与垂直投影-找出人脸特征位置。,生物特征的辨别与验证,人脸识别的功能模块 人脸捕获与跟踪模块 人脸识别比对模块 人脸的建模与检索模块 真人鉴别功能模块 图像质量检测模块,生物特征的辨别与

10、验证,指纹识别技术 指纹的特征 细节特征是实现指纹精确比对的基础,包括指纹的核心点、三角点、端点、叉点和桥接点。辅助特征是纹型、纹密度和纹曲率等元素。 指纹的分类 按纹形特征分类: 根据形态的不同分为“弓型、箕型、斗型”三大类型,以及“孤形、帐形、正箕形、反箕形、环形、螺形、囊形、双箕形和杂形”等九种形态。 按纹理特征分类: 由平均纹密度、纹密度分布、平均纹曲率、纹曲率分布等纹理参数构成。纹理特征多用于计算机指纹识别算法的多维分类及检索。,生物特征的辨别与验证,指纹识别技术 指纹识别系统的组成 指纹识别的传感器技术 光学指纹识别 、电容式指纹识别 、超声波指纹识别 、 生物射频指纹识别,生物特征的辨别与验证,指纹识别技术 指纹识别系统的组成 指纹识别的传感器技术 光学指纹识别 、电容式指纹识别 、超声波指纹识别 、 生物射频指纹识别,生物特征的辨别与验证,虹膜识别的原理与方法 虹膜的特性 (1)唯一性 (2) 稳定性 (3)生物活性 (4)非接触 (5)便于信号处理 (6)防伪性,生物特征的辨别与验证,虹膜识别的原理与方法 虹膜识别的步骤 (1)采集虹膜的图像数据 (2)虹膜的图像分析预处理 (3)根据虹膜的纹理或类型提取特征 (4)调用多媒体数据库的iriscode模板作匹配判断,生物特征的辨别与验证,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号