图像处理和计算机视觉--基础,经典以及最近发展

上传人:简****9 文档编号:95499749 上传时间:2019-08-19 格式:PDF 页数:38 大小:394.15KB
返回 下载 相关 举报
图像处理和计算机视觉--基础,经典以及最近发展_第1页
第1页 / 共38页
图像处理和计算机视觉--基础,经典以及最近发展_第2页
第2页 / 共38页
图像处理和计算机视觉--基础,经典以及最近发展_第3页
第3页 / 共38页
图像处理和计算机视觉--基础,经典以及最近发展_第4页
第4页 / 共38页
图像处理和计算机视觉--基础,经典以及最近发展_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《图像处理和计算机视觉--基础,经典以及最近发展》由会员分享,可在线阅读,更多相关《图像处理和计算机视觉--基础,经典以及最近发展(38页珍藏版)》请在金锄头文库上搜索。

1、 图像处理与计算机视觉图像处理与计算机视觉 基础,经典以及最近发展基础,经典以及最近发展 By xdyang(杨晓冬 ) 一、一、 绪论绪论 1.1. 为什么要写这篇文章为什么要写这篇文章 从 2002 年到现在,接触图像快十年了。虽然没有做出什么很出色的工作, 不过在这个领域摸爬滚打了十年之后, 发现自己对图像处理和计算机视觉的感情 越来越深厚。下班之后看看相关的书籍和文献是一件很惬意的事情。平常的一大 业余爱好就是收集一些相关的文章,尤其是经典的文章,到现在我的电脑里面已 经有了几十 G 的文章。 写这个文档的想法源于我前一段时间整理文献时的一个突 发奇想,既然有这个多文献,何不整理出其中

2、的经典,抓住重点来阅读,同时也 可以共享给大家。 于是当时即兴写了一个 图像处理与计算机视觉中的经典论文 。 现在来看,那个文档写得很一般,所共享的论文也非常之有限。就算如此,还是 得到了一些网友的夸奖,心里感激不尽。因此,一直想下定决心把这个工作给完 善,力求做到尽量全面。 本文是对现有的图像处理和计算机视觉的经典书籍(后面会有推荐)的一个 补充。 一般的图像处理书籍都是介绍性的介绍某个方法,在每个领域内都会引用 几十上百篇参考文献。有时候想深入研究这个领域的时候却发现文献太多,不知 如何选择。 但实际上在每个领域都有那么三五篇抑或更多是非读不可的经典文献。 这些文献除了提出了很经典的算法,

3、同时他们的 Introduction 和 Related work 也是对所在的领域很好的总结。 读通了这几篇文献也就等于深入了解了这个领域, 比单纯的看书收获要多很多。 写本文的目的就是想把自己所了解到的各个领域的 经典文章整理出来,不用迷失在参考文献的汪洋大海里。 2.2. 图像处理和计算机视觉的分类图像处理和计算机视觉的分类 按照当前流行的分类方法,可以分为以下三部分: 图像处理:图像处理:对输入的图像做某种变换,输出仍然是图像,基本不涉及或者很 少涉及图像内容的分析。比较典型的有图像变换,图像增强,图像去噪,图像压 缩, 图像恢复, 二值图像处理等等。 基于阈值的图像分割也属于图像处理

4、的范畴。 一般处理的是单幅图像。 图像分析:图像分析:对图像的内容进行分析, 提取有意义的特征, 以便于后续的处理。 处理的仍然是单幅图像。 计算机视觉:计算机视觉:对图像分析得到的特征进行分析,提取场景的语义表示,让计 算机具有人眼和人脑的能力。这时处理的是多幅图像或者序列图像,当然也包括 部分单幅图像。 关于图像处理,图像分析和计算机视觉的划分并没有一个很统一的标准。一 般的来说, 图像处理的书籍总会或多或少的介绍一些图像分析和计算机视觉的知 识, 比如冈萨雷斯的数字图像处理。而计算机视觉的书籍基本上都会包括图像处 理和图像分析,只是不会介绍的太详细。其实图像处理,图像分析和计算机视觉 都

5、可以纳入到计算机视觉的范畴:图像处理-低层视觉(low level vision) , 图像分析-中间层视觉(middle level vision) ,计算机视觉-高层视觉(high level vision) 。这是一般的计算机视觉或者机器视觉的划分方法。在本文中, 仍然按照传统的方法把这个领域划分为图像处理,图像分析和计算机视觉。 3.3. 图像处理和计算机视觉开源库以及编程语言选择图像处理和计算机视觉开源库以及编程语言选择 目前在图像处理中有两种最重要的语言:c/c+和 matlab。它们各有优点: c/c+比较适合大型的工程,效率较高,而且容易转成硬件语言,是工业界的默 认语言之一。

6、 而 matlab 实现起来比较方便, 适用于算法的快速验证, 而且 matlab 有成熟的工具箱可以使用,比如图像处理工具箱,信号处理工具箱。它们有一个 共同的特点:开源的资源非常多。在学术界 matlab 使用的非常多,很多作者给 出的源代码都是 matlab 版本。最近由于 OpenCV 的兴起和不断完善,c/c+在图 像处理中的作用越来越大。 总的来说, c/c+和 matlab 都必须掌握, 最好是精通, 当然侧重在 c/c+上对找工作会有很大帮助。 至于开源库,个人非常推荐 OpenCV,主要有以下原因: (1) 简单易入手。 OpenCV 进入 OpenCV2.x 的时代后, 使

7、用起来越来越简单, 接口越来越傻瓜化,越来越 matlab 化。只要会 imread,imwrite,imshow 和了解 Mat 的基本操作就可以开 始入手了。 (2) OpenCV 有一堆图像处理和计算机视觉的大牛在维护, bug 在逐步减少, 每个新的版本都会带来不同的惊喜。而且它已经或者逐步在移植到不懂的平台, 并提供了对 Python 的很好的支持。 (3)在 OpenCV 上可以尝试各种最新以及成熟的技术,而不需要自己从头去 写,比如人脸检测(Harr,LBP) ,DPM(Latent SVM) ,高斯背景模型,特征检 测,聚类,hough 变换等等 。而且它还支持各种机器学习方法

8、(SVM,NN,KNN, 决策树,Boosting 等) ,使用起来很简单。 (4)文档内容丰富,并且给出了很多示例程序。当然也有一些地方文档描 述不清楚,不过看看代码就很清楚了。 (5)完全开源。可以从中间提取出任何需要的算法。 (6)从学校出来后,除极少数会继续在学术圈里,大部分还是要进入工业 界。现在在工 业界,c/c+仍是主流,很多公司都会优先考虑熟悉或者精通 OpenCV 的。事实上,在学术界,现在 OpenCV 也大有取代 matlab 之势。以前的 demo 或者 source code,很多作者都愿意给出 matlab 版本的,然后别人再呼哧 呼哧改成 c 版本的。现在作者干脆

9、给出 c/c+版本,或者自己集成到 OpenCV 中 去,这样能快速提升自己的影响力。 如果想在图像处理和计算机视觉界有比较深入的研究, 并且以后打算进入这 个领域工作的话,建议把 OpenCV 作为自己的主攻方向。如果找工作的时候敢号 称自己精通 OpenCV 的话,肯定可以找到一份满意的工作。 4.4. 本文的特点和结构,以及适合的对象本文的特点和结构,以及适合的对象 本文面向的对象是即将进入或者刚刚进入图像处理和计算机视觉领域的童 鞋, 可以在阅读书籍的同时参阅这些文献,能对书中提到的算法有比较深刻的理 解。 由于本文涉及到的范围比较广,如果能对计算机视觉的资深从业者也有一定 的帮助,我

10、将倍感欣慰。为了不至太误人子弟,每一篇文章都或多或少的看了一 下,最不济也看了摘要(这句话实在整理之前写的,实际上由于精力有限,好多 文献都只是大概扫了一眼,然后看了看 google 的引用数,一般在 1000 以上就放 上来了,把这些文章细细品味一遍也是我近一两年之内的目标)。在成文的过程 中,我本人也受益匪浅,希望能对大家也有所帮助。 由于个人精力和视野的关系,有一些我未涉足过的领域不敢斗胆推荐,只是 列出了一些引用率比较高的文章,比如摄像机标定和立体视觉。不过将来,由于 工作或者其他原因,这些领域也会接触到,我会逐步增减这些领域的文章。尽管 如此,仍然会有疏漏,忘见谅。同时文章的挑选也夹

11、带了一些个人的喜好,比如 我个人比较喜欢 low level 方向的,尤其是 IJCV 和 PAMI 上面的文章,因此这方 面也稍微多点,希望不要引起您的反感。如果有什么意见或者建议,欢迎 mail 我。文章和资源我都会在我的 csdn blog 和 sina ishare 同步更新。在此申明: 这些论文的版权归作者及其出版商所有,请勿用于商业目的。 个人个人 blogblog: http:/ 新浪新浪 iaskiask 地址地址: http:/ 本文的安排如下。第一部分是绪论。第二部分是图像处理中所需要用到的理 论基础,主要是这个领域所涉及到的一些比较好的参考书籍。第三部分是计算机 视觉中所

12、涉及到的信号处理和模式识别文章。 由于图像处理与图像分析太难区分 了,第四部分集中讨论了它们。第五部分是计算机视觉部分。最后是小结。 二、二、 图像处理与计算机视觉相关的书籍图像处理与计算机视觉相关的书籍 1.1. 数学数学 我们所说的图像处理实际上就是数字图像处理, 是把真实世界中的连续三维 随机信号投影到传感器的二维平面上,采样并量化后得到二维矩阵。数字图像处 理就是二维矩阵的处理, 而从二维图像中恢复出三维场景就是计算机视觉的主要 任务之一。这里面就涉及到了图像处理所涉及到的三个重要属性:连续性,二维 矩阵, 随机性。所对应的数学知识是高等数学(微积分),线性代数(矩阵论), 概率论和随

13、机过程。这三门课也是考研数学的三个组成部分,构成了图像处理和 计算机视觉最基础的数学基础。如果想要更进一步,就要到网上搜搜林达华推荐 的数学书目了。 2.2. 信号处理信号处理 图像处理其实就是二维和三维信号处理,而处理的信号又有一定的随机性, 因此经典信号处理和随机信号处理都是图像处理和计算机视觉中必备的理论基 础。 2.1 经典信号处理 信号与系统信号与系统(第 2 版) Alan V.Oppenheim 等著 刘树棠译 离散时间信号处理离散时间信号处理(第 2 版) A.V.奥本海姆等著 刘树棠译 数字信号处理数字信号处理: :理论算法与实现理论算法与实现 胡广书 (编者) 2.2 随机

14、信号处理 现代信号处理现代信号处理 张贤达著 统计信号处理基础统计信号处理基础: :估计与检测理论估计与检测理论 Steven M.Kay 等著 罗鹏飞等译 自适应滤波器原理自适应滤波器原理(第 4 版) Simon Haykin 著 郑宝玉等译 2.3 小波变换 信号处理的小波导引信号处理的小波导引: :稀疏方法稀疏方法(原书第 3 版) tephane Malla 著, 戴道清 等译 2.4 信息论 信息论基础信息论基础(原书第 2 版) Thomas M.Cover 等著 阮吉寿等译 3.3. 模式识别模式识别 Pattern Recognition and Machine Learni

15、ng BishopPattern Recognition and Machine Learning Bishop, Christopher M. Springer 模式识别模式识别(英文版)(第 4 版) 西奥多里德斯著 Pattern ClassificationPattern Classification (2nd Edition) Richard O. Duda 等著 S Statistical Pattern Recognitiontatistical Pattern Recognition, 3rd Edition Andrew R. Webb 等著 模式识别模式识别(第 3 版)

16、张学工著 4.4. 图像处理与计算机视觉的书籍推荐图像处理与计算机视觉的书籍推荐 图像处理,分析与机器视觉图像处理,分析与机器视觉 第三版 Sonka 等著 艾海舟等译 Image Processing, Analysis and Machine VisionImage Processing, Analysis and Machine Vision 这本书是图像处理与计算机视觉里面比较全的一本书了, 几乎涵盖了图像视 觉领域的各个方面。中文版的个人感觉也还可以,值得一看。 数字图像处理数字图像处理 第三版 冈萨雷斯等著 Digital IDigital Im mage Processingage Processing 数字图像处理永远的经典,现在已经出到了第三版,相当给力。我的导师曾 经说过,这本书写的很优美,对写英文论文也很有

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号