计算机视觉教程 教学课件 ppt 作者 章毓晋 CCV14

上传人:E**** 文档编号:89489163 上传时间:2019-05-25 格式:PPT 页数:32 大小:1.21MB
返回 下载 相关 举报
计算机视觉教程 教学课件 ppt 作者  章毓晋 CCV14_第1页
第1页 / 共32页
计算机视觉教程 教学课件 ppt 作者  章毓晋 CCV14_第2页
第2页 / 共32页
计算机视觉教程 教学课件 ppt 作者  章毓晋 CCV14_第3页
第3页 / 共32页
计算机视觉教程 教学课件 ppt 作者  章毓晋 CCV14_第4页
第4页 / 共32页
计算机视觉教程 教学课件 ppt 作者  章毓晋 CCV14_第5页
第5页 / 共32页
点击查看更多>>
资源描述

《计算机视觉教程 教学课件 ppt 作者 章毓晋 CCV14》由会员分享,可在线阅读,更多相关《计算机视觉教程 教学课件 ppt 作者 章毓晋 CCV14(32页珍藏版)》请在金锄头文库上搜索。

1、第14章 场景解释,14.1 线条图标记解释 14.2 体育比赛视频排序 14.3 计算机视觉系统模型 14.4 计算机视觉理论框架,14.1 线条图标记解释,1. 轮廓标记 在线条图中对轮廓进行标记时的一些名词概念 (1) 刃边 (2) 翼边 (3) 折痕 (4) 痕迹 (5) 阴影,14.1 线条图标记解释,2. 结构推理 三面角点目标,处于常规位置,14.1 线条图标记解释,2. 结构推理,14.1 线条图标记解释,3. 回朔标记 已知2-D线条图中的一组边,要给每条边赋一个标记,以解释3-D的情况 回朔标记法将边排成序列,以深度优先的方式生成通路,依次对每条边进行所有可能的标记,检验新

2、标记与其他边标记的一致性,依次赋给 所有边的标记都满足一致性,则得到一种 标记结果 棱锥4个顶点分别用A,B,C,D表示,14.1 线条图标记解释,14.2 体育比赛视频排序,1. 体育比赛视频的特点 一般均有较强的结构性 总有一些高潮事件 环境是特定的,比赛中有许多不定因素,事件发生的时间位置不能事先确定,所以比赛中无法控制视频生成过程 有关特殊事件的精彩镜头是一大看点 使用先验知识对精彩事件进行定义检测,14.2 体育比赛视频排序,2. 比赛节目的结构(乒乓球比赛) 比赛事件、发球事件、场间休息、观众和重放 将节目中的镜头根据场景进行非监督聚类,14.2 体育比赛视频排序,3. 目标检测和

3、跟踪 基于客观指标 运动员检测 球桌检测 球检测 运动员跟踪 乒乓球跟踪,14.2 体育比赛视频排序,3. 目标检测和跟踪 白线框为运动员外接盒 跟踪得到的乒乓球轨迹,14.2 体育比赛视频排序,4. 精彩度判定和排序 (1) 基本层的排序 球运动的平均速度 连续两次击球间球运动的平均距离 运动员连续两次击球间运动的平均距离,14.2 体育比赛视频排序,4. 精彩度判定和排序 (2) 品质层的排序 运动员移动的激烈程度 球轨迹的品质 击球的变化,14.3 计算机视觉系统模型,14.3.1 多层次串行结构 14.3.2 以知识库为中心的辐 射结构 14.3.3 多模块交叉配合结构,14.3.1

4、多层次串行结构,将图像理解过程看作是一个信息加工过程,具有确定的输入和输出,因而将图像理解系统组织成一系列分别处于不同层次的模块并以串行方式结合起 来,每个模块(在其他模块的协同配合下)按顺序执行一些特定的工作,从而逐步完成预定的视觉任务 由底向上的处理,比较通用,但不一定总有 效。由顶向下的处理,在约束充分时效率会比较高,反之则不实用,14.3.1 多层次串行结构,14.3.2 以知识库为中心的辐射结构,可以看作是一种类比于人类视觉系统的结构。它的特点是以知识为中心,系统整体不分层,信号在各个模块及知识库中多次进行交换处理,14.3.3 多模块交叉配合结构,将整个系统分成多个模块,各有确定的

5、输入和输出,且互相配合交叉,比较灵活 一个图,其中每个结点代表一个加工过程或加工任务,而结点间的连接则反映了信息的流动和过程的联系 本书的整体框架,即本书所采用的计算机视觉系统框架是对上述多模块交叉配合结构的系统框图根据教学需求经过调整而得到的,14.3.3 多模块交叉配合结构,14.4 计算机视觉理论框架,14.4.1 马尔视觉计算理论 14.4.2 对马尔理论框架的改进 14.4.3 新理论框架的研究,14.4.1 马尔视觉计算理论,1. 视觉是一个复杂的信息加工过程 要解决两个问题。一个是视觉信息的表达问 题,另一个是视觉信息的加工问题 2. 视觉信息加工的三个要素,14.4.1 马尔视

6、觉计算理论,2. 视觉信息加工的三个要素 一个任务要用计算机完成,它应该是可以被计算的。这就是可计算性问题,需要用计算理论来回答 有了计算理论后,还必须要有算法实现,为此需要给加工所操作的实体选择一种合适的表达 有了表达和算法,在物理上如何实现算法也是必不可少的。特别是随着对实时性要求的不断提高,专用的硬件实现问题常常被提出来,14.4.1 马尔视觉计算理论,2. 视觉信息加工的三个要素 上述三个要素之间有一定的逻辑因果联系,但并无绝对的依赖关系 箭头正向表示带有指导的含义,反过来则有作为基础的含义,14.4.1 马尔视觉计算理论,3. 视觉信息的三级内部表达 (1) 基素表达 一种2-D表达

7、,它是图像特征的集合 (2) 2.5-D表达 完全是为了适应计算机的运算功能而提出来的 (3) 3-D表达 以物体为中心(也包括了物体的不可见部分)的表达形式,14.4.1 马尔视觉计算理论,3. 视觉信息的三级内部表达 如何由原始图的像素表达出发,通过基素表达和2.5-D表达,最后得到3-D表达,14.4.1 马尔视觉计算理论,4. 视觉信息处理是按照功能模块的形式组织 起来的 视觉信息系统应该包括许多模块,每个模块获取某一特定的视觉线索,进行一定的加工 5. 计算理论形式化表示必须考虑约束条件 约束条件一般是借助先验知识获得的,利用约束条件可改变病态问题,14.4.2 对马尔理论框架的改进

8、,马尔的理论也有其不足之处: (1) 框架中输入是被动的,给什么图像,系统就处理什么图像 (2) 框架中加工目的不变,总是恢复场景中物体的位置和形状等 (3) 框架缺乏或者说未足够重视高层知识的指导作用 (4) 整个框架中信息加工过程基本自下而上,单向流动,没有反馈,14.4.2 对马尔理论框架的改进,4个方面的改进: (1) 主动视觉 (2) 有目的视觉 (3) 高层知识 (4) 反馈控制,14.4.3 新理论框架的研究,1. 基于知识的理论框架 (1) 从图像特征中提取那些相对于观察方向在大范围内保持不变的分组和结构 (2) 利用概率排队的方法减小搜索空间 (3) 使3-D模型的投影直接与

9、图像特征相匹配,14.4.3 新理论框架的研究,2. 主动视觉理论框架 (1) 选择注意机制 (2) 注视控制,14.4.3 新理论框架的研究,3. 计算机视觉的最终目标 人类视觉系统是相当通用的计算机视觉系统。计算机视觉研究的一个重要目标就是要建立能完成各种视觉任务的通用系统 计算机视觉是一个牵涉人类智能的问题。对于许多看起来非常简单的人类智能是否可能在计算机上复现,至今还没有定论 这是一个值得研究和有所作为的领域,有着光明的前景,让我们一起努力吧!,教程作者(章毓晋)联系信息,通信地址:北京清华大学电子工程系 邮政编码:100084 办公地址:清华大学东主楼,9区307室 办公电话:(010)62781430 传真号码:(010)62770317 电子邮件:zhang- 个人主页: (下载更新的讲稿和教程修改表),

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号