第二章DIP基础

上传人:汽*** 文档编号:568504344 上传时间:2024-07-24 格式:PPT 页数:58 大小:3.14MB
返回 下载 相关 举报
第二章DIP基础_第1页
第1页 / 共58页
第二章DIP基础_第2页
第2页 / 共58页
第二章DIP基础_第3页
第3页 / 共58页
第二章DIP基础_第4页
第4页 / 共58页
第二章DIP基础_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《第二章DIP基础》由会员分享,可在线阅读,更多相关《第二章DIP基础(58页珍藏版)》请在金锄头文库上搜索。

1、信息技术学院 广州中医药大学第二章 DIP基础 人眼视觉要素 图像感知与获取 图像取样和量化 数字图像的基本格式 象素间的基本关系本章主要介绍几个与数字图像有关的概念、几种基本的图像传感和获取的手段、图像取样和量化的相关概念、图像在计算机中的表现形式(格式)以及图像象素间的最主要关系。信息技术学院 广州中医药大学人眼视觉基础虽然DIP主要是基于数学和概率等学科的理论体系发展起来的,但人的视觉直觉在选择某个DIP技术时扮演了中心的角色,一切DIP处理的效果可能都由人的视觉来衡量,尽管其带有很大的主观性。因此,对人视觉的基本了解应该作为我们课程的前提。1. 人眼构造及视觉图像人眼的平均直径近似为2

2、0m虹膜中央开口(瞳孔)的直径在28mm之间视网膜上有两类光接受器:锥状体(cones)和杆状体(rods)每只眼睛锥状体数在600700万之间,其主要位于视网膜的中间部分(中央凹,辨认图像细节,锥状视觉也称白昼视觉或亮视觉。杆状体数约7 500到15 000万个,分布在视网膜表面,感受总体图像,称夜视觉或暗视觉。中央凹是视网膜上直径约为1.5mm的圆形缺口,可以近似看作1.51.5的方形传感器阵列。该区域锥状体的密度大概为150 000/mm2,因此大概共有337 000个元素。根据原始分辨能力计算,一5mm5mm大小的中等分辨率的电荷耦合器件(charge-coupled device,

3、CCD)大约有这么多敏感元素。信息技术学院 广州中医药大学人眼的横截面图信息技术学院 广州中医药大学视网膜上杆状体和锥状体的分布曲线信息技术学院 广州中医药大学人眼中的图像焦深:晶状体的中央到视网膜间的距离,大约17mm14mm,其折射能力最小到最大。像大小计算:15/100=h/17信息技术学院 广州中医药大学2. 亮度适应性和辨别力在呈现图像处理结果时,人眼区分不同亮度/强度水平的能力是一个要考虑的重要方面。人视觉系统所能适应的的光强度范围是非常宽的,达1010数量级,主观亮度 (subjective brightness)是光强的对数函数。但人的视觉不可能同时在整个范围内工作,其能同时辨

4、别的光强度级范围是很小的(brightness adaptation)。在所观察对象的亮度适应级发生改变时,人眼有一个逐渐适应的过程。在某个特殊适应水平的主观亮度敏感范围信息技术学院 广州中医药大学亮度鉴别能力和光幻觉实验:a) 韦伯比(Weber Ratio)IC/I,右边曲线表明当背景亮度增加时,视觉辨别力明显增加,也即韦伯比减少。这与杆状体和锥状体表现的功能是一致的。信息技术学院 广州中医药大学b) 马赫带效应(Mach Bands Effect):人眼所感觉的亮度并不死强度的简单函数,Mach效应(1865年由Ernst Mach所发现的现象)表明视觉系统有趋向于过高或过低估计不同亮度

5、区域边界值的现象。信息技术学院 广州中医药大学c) 同时对比度实验信息技术学院 广州中医药大学d) 光幻觉(Optical illusions)光幻觉是人视觉系统所特有的,迄今还没有清楚的解释。由于以上各种特殊现象,在进行图像处理时,应该采取一些特殊的补偿措施。信息技术学院 广州中医药大学图像感知与获取1. 单个传感器模拟电视摄像机扫描原理:单传感器+线性扫描+旋转信息技术学院 广州中医药大学2. 传感器带与阵列信息技术学院 广州中医药大学图像取样和量化信息技术学院 广州中医药大学信息技术学院 广州中医药大学产生一副数字图像:a) 连续图像;b)从A到B的扫描线;c)采样和量化;d)数字扫描线

6、1. 基本过程:其结果产生一副二值或非二值图像信息技术学院 广州中医药大学数字图像:空间量化+幅值量化示例:信息技术学院 广州中医药大学2. 数字图像表示2.1 坐标定义:信息技术学院 广州中医药大学2.2 二值图像:信息技术学院 广州中医药大学2.3 非二值图像信息技术学院 广州中医药大学2.4 数学表示和大小计算在某些讨论,尤其是数学计算中,可以用传统的矩阵表示方法来表示数字图像和象素。通常要求灰度级的是2的整数次幂:L2k, 这样一副MN大小的数字图像所需要的存储位数b为:b=M*N*k当一副图像有2k级灰度时,通常称该图像为k位图像。如256级灰度图像就叫8位图像。信息技术学院 广州中

7、医药大学2.5 空间和灰度/幅度分辨率空间分辨率:一副图像中可分辨的最小细节,或单位距离可分辨的最少数目的线对。灰度分辨率:可察觉的最小灰度变化(主观的)当实际的物理分辨率测量不必要时,通常就称数字图像的大小为空间分辨率,而灰度级数为灰度分辨率。这样,图像的空间分辨率主要由采样决定,而幅度分辨率主要由量化所决定。且一般都将这些量取作2的整数幂。 图像空间分辨率产生的结果:注意后5副图像都通过行和列复制的方法重采样到了512512信息技术学院 广州中医药大学信息技术学院 广州中医药大学 图像幅度分辨率产生的结果:信息技术学院 广州中医药大学2.6 混叠(aliasing)效应和莫尔图(Moire

8、 Pattern,晶格光干涉效应) 其曲线下面面积有限的函数能展开成各种不同频率的正弦波和余弦波的组合(在后面的频率域图像增强技术中将进行详细的讨论)。当函数具有无限持续期和最高频率为有限时(带限函数),根据Shannon采样定理,如果采样频率等于或大于函数最高频率的两倍,则该函数就可根据其采样完全重建。如果低于两倍(欠采样),则会发生混叠现象,并将引入多余的频率分量,称为混叠频率。实际情况中(周期函数除外),采样定律总是难以满足,因为所处理的采样数据总是有限的。加窗可以把无限持续期函数转变成有限持续期,但同时也把频率扩展到了无限,带限和有限持续期两个条件往往难以同时满足,这就违背了采样定律,

9、混叠效应不可避免。减少混叠效应的一个基本方法是在采样前通过使图像模糊来减少高频分量。对周期函数,当采样恰好覆盖的是函数的整数倍周期时,则能由采样点来恢复原函数。混叠频率可以在适当的条件下通过莫尔图(水纹图)来观察到。信息技术学院 广州中医药大学莫尔效应说明实例信息技术学院 广州中医药大学图像文件存储格式格式不同,其对图像数据的压缩编码方式不同。信息技术学院 广州中医药大学1. BMP格式n BMP格式是Microsoft公司为其windows环境开发的标准图像格式,是一种与设备无关的点阵位图文件格式n 虽然大部分BMP文件是不压缩的形式,其本身还是支持图像压缩的,如rle ( run leng

10、th encoding)格式和LZW压缩格式等信息技术学院 广州中医药大学nBMP是BitMap Pixel是缩写,意思是对数字图像每个像素,均列出每一位。国内翻译成位图。基本上它是一种非压缩图像格式。nBMP 图像文件的结构可分为三部分:文件头、位图信息头和图像数据BMP文件结构信息技术学院 广州中医药大学BMP图像文件头信息技术学院 广州中医药大学文件头是一个BITMAPFILEHEADER的数据结构。定义为Typedef structtag BITMAPFILEHEADERWORD bftype;DWORD bfsize;DWORD bfReserved1;DWORD bfReserve

11、d2;DWORD bfoffBits;BITMAPFILEHEADER;信息技术学院 广州中医药大学图像信息头(1)信息技术学院 广州中医药大学图像信息头(2)信息技术学院 广州中医药大学图像信息头(3)信息技术学院 广州中医药大学图像信息头结构定义信息技术学院 广州中医药大学位图数据表示每个像素索引亮度或色彩的数据。像素间相对位置保持不变,但像素数据的具体存储试依图像尺寸、像素位数、压缩方式等共同决定。对于8位灰度图像或256色彩色图像,每个像素占用一个字节。对于真彩色图像,没有调色板,每个像素数据均为红、绿、篮三色值,每个色值为8位,一个字节,共三个字节。注意:由于windows系统管理存

12、储器要求以4个字节为单位,因此位图每行像素占用的字节总数必须为4的整数倍。如果不是,必须补0.信息技术学院 广州中医药大学调色板(color palette)和图像数据调色板是关于一种数字图像像素色彩描述技术的形象说法。其实质是一种索引存储结构。信息技术学院 广州中医药大学JPEG文件格式信息技术学院 广州中医药大学JPEG文件格式的特点n静止图像压缩n采用有损编码方式n是一种变换编码n对高频、低频信号区别对待信息技术学院 广州中医药大学JPEG文件的标记n用以区分和识别图像数据及其相关信息 n每个标记都是由2个字节组成,其前一个字节是固定值0xFF 信息技术学院 广州中医药大学JPEG文件的

13、组织(1)图像开始SOI(Start of Image)标记 (2)APP0标记(Marker) 信息技术学院 广州中医药大学(3) APPn标记(Markers),其中n=115(任选) APPn长度详细信息(4) 一个或者多个量化表DQT量化表长度(quantization table length)量化表数目(quantization table number)量化表(quantization table) 信息技术学院 广州中医药大学(5) 帧图像开始SOF0(Start of Frame)信息技术学院 广州中医药大学(6) 一个或者多个霍夫曼表DHT霍夫曼表的长度(Huffman t

14、able length)类型、AC或者DC(Type, AC or DC)索引(Index) 位表(bits table) 值表(value table)(7) 扫描开始SOS(Start of Scan) 扫描开始长度(start of scan length)颜色分量数(number of color components)每个颜色分量ID交流系数表号 (AC table #)直流系数表号 (DC table #)压缩图像数据 (Compress image data) (8) 图像结束EOI(End of Image)信息技术学院 广州中医药大学JPEG编码原理信息技术学院 广州中医药大

15、学JPEG文件结构信息技术学院 广州中医药大学3. GIF格式信息技术学院 广州中医药大学GIF文件结构信息技术学院 广州中医药大学4.TIFF文件格式 信息技术学院 广州中医药大学信息技术学院 广州中医药大学信息技术学院 广州中医药大学信息技术学院 广州中医药大学图像象素间的基本关系象素间基本关系的描述是基于象素邻域操作的算法的基础。近邻处理方法是许多图像增强和恢复技术的核心内容。同时,由于该方法的计算速度和软硬件实现的简单性,是它成为商业应用领域域最受欢迎的方法之一。1. 象素邻域(neigbbors):这些象素称p的4邻域,表示为N4(p).表示为ND(p). 并与N4(p)一起称为p的

16、8邻域,表示为N8(p).当p为边界元素时,这些邻域象素可能落在图像的外边信息技术学院 广州中医药大学2. 邻接性(adjacency)、连通性(connectivity)、区域(regions)、边界(boundaries)、边沿(edge)例如:信息技术学院 广州中医药大学如果两个图像子集s1和s2中的某些象素是相邻的,则称这两个子集相邻。通路的概念:信息技术学院 广州中医药大学如果R是一个图像子集,且是一个连通集(connected set),则称R为图像的一个区域(Region)。但通常ROI(Region of Interest)是用户自定义的。边界指区域中的这样一些元素集合,其有一个或多个邻域象素不在该区域当中。边界是闭合路径。边沿(缘):超过某个灰度阈值的所有象素点组成,是基于灰度级不连续性的测度。可把其看作图像强度的不连续性。其他几个概念:信息技术学院 广州中医药大学3. 象素间距离测度信息技术学院 广州中医药大学信息技术学院 广州中医药大学

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号