目标检测和识别

上传人:我*** 文档编号:133313062 上传时间:2020-05-26 格式:PDF 页数:148 大小:5.27MB
返回 下载 相关 举报
目标检测和识别_第1页
第1页 / 共148页
目标检测和识别_第2页
第2页 / 共148页
目标检测和识别_第3页
第3页 / 共148页
目标检测和识别_第4页
第4页 / 共148页
目标检测和识别_第5页
第5页 / 共148页
点击查看更多>>
资源描述

《目标检测和识别》由会员分享,可在线阅读,更多相关《目标检测和识别(148页珍藏版)》请在金锄头文库上搜索。

1、第 11 章 目标检测与识别 主要内容提纲 基本概念和方法基本概念和方法 目标特征分析目标特征分析 基于特征描述子 模板 目标检测基于特征描述子 模板 目标检测 基于形状特征 模型 的飞机识别基于形状特征 模型 的飞机识别 基于边缘特征的舰船检测基于边缘特征的舰船检测 基于显著图的目标检测基于显著图的目标检测 Adaboost方法方法 SAR目标检测目标检测 深度学习方法深度学习方法 主要内容提纲 基本概念和方法基本概念和方法 目标特征分析目标特征分析 基于特征描述子 模板 目标检测基于特征描述子 模板 目标检测 基于形状特征 模型 的飞机识别基于形状特征 模型 的飞机识别 基于边缘特征的舰船

2、检测基于边缘特征的舰船检测 基于显著图的目标检测基于显著图的目标检测 Adaboost方法方法 SAR目标检测目标检测 深度学习方法深度学习方法 目标检测是计算机视觉和模式识别的重要 研究方向 任务就是确定图像中是否有感兴趣的目标 存在 并对其进行探测和精确定位 目标检测可以定义为通过某种技术手段 对遥感观测图像和数据中的感兴趣目标进 行位置定位和目标辨别的过程 1 基本概念 1 基本概念 目标检测可以根据对目标对象认知的程度 划分为若干的等级 目标检测的最低等级是分辨目标的有无 即简单的判断感兴趣的目标是否存在以及 存在的目标位置 最高等级除了对目标标识有无以外 还要 对存在的对象进行精确的

3、识别和描述 二分法 遥感图像 背景 目标 应用中要对得到的目标进行毁伤信息的提 取与分析 对目标的真实类型和型号并不 感兴趣 比如对于军用机场中的飞机并不 关心它是F 16还是F 22 对于桥梁 并不关心它是否是吊桥还是拱 桥 对于舰船 并不关心它是驱逐舰还是护卫 舰 而且就中低分辨率的图像来讲 这些 识别也是无法做到的 1 基本概念 目标识别 目标识别 对目标进行确认 可以通过图 像的几何外观 纹理 材质等方面的属性 和特征来目标进行精确的界定和描述 从广义角度看 识别的过程可以将目标和 背景以及其他可疑对象区分开来 如飞机 和机场 就是目标检测 从狭义角度看 识别的过程是把相似目标 对象间

4、划分得更为具体 飞机的不同型号 解决目标的具体归属或型号 目标识别的难点 高分分辨率图像 信息丰富 复杂 地物 和目标多样性 影响图像上的目标因素多 光照不同 遮 挡 形变 角度不同 背景干扰 需要精确提取目标的外观特征 空间结构 信息 一些目标的细节决定了目标的类别 精确 的轮廓 几何尺寸 材料 分辨率越来越高 数据量越来越大 目标自动检测和识别 实时 快速 更少的人力 财力 相对于低分辨率 很多目标的检测识别成为可 能 军事目标侦察 城市规划等各种军用和民用领 域应用 SPOT 5 IKONOS 2 Quick Bird 2 World View 2 Geo Eye 1 分辨率 m 2 5

5、 1 0 0 61 0 5 0 41 周期 天 2 6 3 11 1 3 1 1 c I Step 4 全图检测 大于阈值的为目标象素点 反之 为杂波象素点 2 2ln cfa IP SAR目标检测的重要方法 CFAR 目标检测结果目标检测结果 原始原始MSTAR SAR图像图像 MSTAR 0 3m分辨率机载SAR图像目标检测 目标鉴别结果目标鉴别结果 原始原始图像图像 目标目标检测结果检测结果 目标目标鉴别结果鉴别结果 ADTS 0 3m分辨率机载分辨率机载SAR图像目标检测图像目标检测 总共4个机动目标 全部被检测 没有虚警 SAR图像油库检测结果 机场SAR图像飞机检测 机场SAR图像

6、 飞机检测结果 舰船目标检测 舰船目标提取流程舰船目标提取流程 主要内容提纲 基本概念和方法基本概念和方法 目标特征分析目标特征分析 基于特征描述子 模板 目标检测基于特征描述子 模板 目标检测 基于形状特征 模型 的飞机识别基于形状特征 模型 的飞机识别 基于边缘特征的舰船检测基于边缘特征的舰船检测 基于显著图的目标检测基于显著图的目标检测 Adaboost方法方法 SAR目标检测目标检测 深度学习方法深度学习方法 深度学习 大样本数据 深度学习是机器学习中一个新的研究领域 也为识别问题 的研究带来新的研究思路 通过建立模拟人脑进行分析 学习的神经网络来解释图像 声音和文本等数据 深度学习的

7、概念是2006年由加拿大多伦多大学计算机系 G E Hinton教授提出 基于深度学习的方法已经在语音识别 信号处理 图像处 理以及模式识别领域取得了突破性进展 深度学习所表现出来的巨大潜力吸引了众多研究者的关注 Microsoft Google IBM 百度 Facebook等大型互联网 公司也纷纷建立了深度学习部门 对深度学习展开深入研 究 深度学习的现状 目前深度学习在机器学习研究领域异军突起 被 MIT技术综述 评为2013年十大突破性技术之 一 深度学习不仅在科研领域引起了广泛关注 在实 用至上的商业应用中也展现了卓越的 智能 2012年6月 时代 周刊报道了google公司的 go

8、ogle大脑 项目 其核心技术正是深度神 经网络 2012年11月 微软公开演示了一个同声传译系 统 其支撑技术也是深度学习 深度学习的现状 2009年 2013年 深度结构在著名的ICDAR会议上的手写 识别竞赛中多次夺魁 至今 目标检测 视觉识别领域中 的各项国际竞赛中识别率的纪录不断被深度结构所刷新 例如MICCA 2013 ICDAR 2013比赛中都由Schmidhuber团 队拔得头筹 该团队采用的正是以GPU为处理器的多列最 大聚合方式的卷积神经网络 GPU MCMPCNN 的深度结 构 2014年开年之际 自然 杂志中所评述的 深度学习 使计算机向真正人工智能迈出了一大步 以限

9、制性 Boltzmann机为单元构建了深度信念网络 Deep Belief Network 在图像模式识别上获取了近乎完美的实验结果 深度学习的历史发展 深度学习本质上是对复杂的非线性模型的学习 其产生 与发展代表着机器学习技术的自然演进 1957年 由Rosenblatt提出的以感知机模型 Perceptrons 为代表的第一代神经网络 是线性模型 可以看作是两 层神经网络 通过学习如何给人工 Hand coded 特征 加权来识别对象 由于使用人工特征 这种网络调整权 值的学习算法很简洁 但也导致它们的学习能力受到了 极大地限制 1986年 由Rumelhart提出的以反向传播 Backp

10、ropagate BP 为代表的第二代神经网络 将反向传播算法用于三 层结构的神经网络 代表着简单的非线性模型 深度学习的历史发展 1995年 由Vapnik等发明的支持向量机 Support Vector Machines SVM 基于径向基函数 Radial Basis Function RBF 核函数的SVM等价于三层的神 经网络 也是一种简单的非线性模型 2006年以后 以深度学习 Deep learning 为代表的 多于三层结构的神经网络 又被称为深度神经网络 是复杂的非线性模型 这是人工神经网络研究在上世 纪末从蓬勃发展到陷入低潮之后 再次产生的重大突 破 深度学习的结构 受到人

11、脑视觉系统层次化工作模式的启发 深度学习是一种具 有层次化结构的深度人工神经网络模型 这种非常复杂的非线 性模型 拥有大量的网络参数与复杂的网络结构 但其具有非 常强大的表示能力 特别适合于处理复杂的模式识别问题 从结构上讲 目前的深度神经网络模型还有若干变种 如深度 卷积神经网络 深度递归神经网络 Deep Recurrent Neural Network 等类别 随着神经网络层数的增大 神经元数目的增加 其处理复杂的 非线性问题的能力也随之增大 著名的AlexNet深度卷积神经 网络 在2012年的ImageNet大赛中取得了远高于第二名的Top5 分类准确率 该网络具有11层 65万个神

12、经元 6千万个参数 将120万张自然影像分到1千个类别中 达到了85 的Top5分类 准确率 深度学习的目的 通过逐层的构建一个多层的网络来使得机器能 自动地学习到反映隐含在数据内部的关系 从 而使得学习到的特征更具有推广性和表达力 由于深度网络可以无监督地从数据中学习到特 征 而这种学习方式也符合人类感知世界的机 理 因此当训练样本足够多的时候通过深度网 络学习到的特征往往具有一定的语义特征 并 且更适合目标的识别 深度学习的特点 深度学习是机器学习分支之一 就是模拟人脑 的信息处理方式 构建类似于人脑的人工神经 网络 从原始输入中 自主地 由低层到高层 逐步地 抽象出合适的表示形式 深度学

13、习的研究源于人们对人工智能的追求 人们希望计算机可以具备 智能 即 可以 足够好地对我们的世界建立模型 存储知识 并依据这些知识回答问题 更能进一步地泛化 生成新的内容 深度学习的特点 深度学习得到的是一个多层的深度结构 信号 在这个多层结构中进行传播 最后得到信号的 表达 这里的深度结构指的是层数多于一层的 非线性函数关系 从这个角度来说 多层神经 网络可以看做是深度学习的一个子类 从本质上说 任何一个多层的非线性结构都可 以称之为深度结构 而深度学习则是学习这个 深度结构的算法 人脑处理的特点 人脑处理信息具有分层次分层次 分布式表示 稀疏 分布式表示 稀疏 以及深深 度结构度结构三个重要

14、特征 人类大脑是一个深度结构 给定一个感知上的输入 人 脑将其表示为多个层次的抽象 其中每个层次都对应于 皮质的不同区域 视觉系统尤为如此 其处理信息的过 程可看做这样的序列 首先进行边缘检测 然后从中抽 象出粗略形状 再逐步地抽象出更为复杂的视觉形状 人脑中的每一层抽象的表示都是以分布式的形式表现的 即 信息不是局部地存储在某个特定的神经元上 而是 分布在许多神经元中 为了分布式地表示信息 人脑采 用了 稀疏 表示形式 即 在某个时间点上只有 1 4 的神经元是激活的 深度学习的本质是学习到多层的非线性的 函数关系 这种多层的非线性的函数关系 使得人们能够更好地对视觉信息进行建模 从而更好地

15、理解图像和视频 深度学习的优点在于模型的表达能力强 能够更好地处理诸如目标和行为识别这种 非常复杂的问题 学习到更加复杂的函数 关系 同时这种方法也有一定的生物学基 础 深度学习的网络结构 深度学习的要点 深度结构 深度结构 结构中层次的数目 几十年来 寻求深度结构是 神经网络研究者们的共识 一般的神经网络都采用经典的反 向传播算法 以误差为变量修正指标 但是 当误差在多层 的网络中传播时会出现弥散 变量无法得到有效的更新 从 而导致学习效果很不理想 2006年深度结构有了突破性进展 Hinton提出了基于限制性 Boltzman机的深度信念网络 该深度结构的核心是将若干个 限制性Boltzm

16、an机堆叠起来 分别分层次地对各个层次采用 无监督贪心算法做预训练 再利用反向传播算法对整体深度 网络做调协 成功地完成了该深度结构的训练学习 随后 基于自动编码器的其他深度结构相继提出 包括普通自动编 码器 Autoencoder AE 稀疏自动编码器以及降噪自动编码器 等 分层表示分层表示 面对人工智能任务 将任务分解成若干个子问 题 以及多个层次的表示 机器视觉系统一般 从像素点出发 第一层先提取低层不变特征 如Gabor滤波器检测边缘特征 在随后的 层次中 逐步地变换他们 如使其具有对比不 变性 反转不变性等 有时也使用特征聚合 最后再提取出反复出现的特征 深度学习就是要发掘这些从最底层特征到最高 层概念一步一步地提炼抽象化的规律 而且我 们希望这个过程是自动地 无监督地完成的 无监督学习无监督学习 自动地学习各层次上的抽象规律 学习从输入到输出的 映射 无监督学习中对优化的特定约束条件可使得模型不仅能 捕获输入数据与目标函数的对应关系 还可以获取输入 数据自身的统计规律 这有助于避免系统泛化时陷入局 部极小点 无监督学习对于学习高层特征尤为重要 因为人也不知 道如何解析地具化

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号