数字视频处理 复习

上传人:我** 文档编号:113788126 上传时间:2019-11-09 格式:DOC 页数:8 大小:58.50KB
返回 下载 相关 举报
数字视频处理 复习_第1页
第1页 / 共8页
数字视频处理 复习_第2页
第2页 / 共8页
数字视频处理 复习_第3页
第3页 / 共8页
数字视频处理 复习_第4页
第4页 / 共8页
数字视频处理 复习_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《数字视频处理 复习》由会员分享,可在线阅读,更多相关《数字视频处理 复习(8页珍藏版)》请在金锄头文库上搜索。

1、数字视频处理 复习题1. 何谓量化噪声,用什么方法可减小(或消除)它?量化噪声:量化器的功能是按照一定的量化规则对取样信号的幅度值作近似表示,使量化器输出的幅度值的大小为有限个数.由于以有限个离散值近似表示无限个连续值,因此模拟信号经过量化后会产生量化误差,由此产生的失真称为量化失真(量化噪声).方法: 过采样+抽取滤波的方法在通讯系统中,特别是ADC通路设计中很常见,目的是降低量化噪声,减少硬件资源2. 假设黑白电视信号的带宽为5MHz,若按256级量化,试计算按无失真取样准则取样时的数据速率.若电视节目按25帧/S发送,则存储一帧黑白电视图像数据需要多大的存储容量?3. 简述人眼感觉彩色的

2、机理人眼是一个构造极其复杂的器官,形状近似球体。当人眼注视外界某物体时,由物体发出或反射、透视的光线通过眼球聚焦在视网膜上。视网膜上的光敏细胞受光刺激产生神经冲动,经视觉神经传递到视觉中枢,就产生了视觉。视网膜上有大量的杆状细胞和锥状细胞。杆状细胞对明暗程度很敏感,对色彩分辨迟钝;锥状细胞既能区分光的强弱,又能分辨光的颜色;杆状细胞对弱光的灵敏度高,对强光失去作用;锥状细胞在强光下才起作用,产生色感,分辨细节。在弱光下杆状细胞起作用,只能看到黑白景象;强光下锥状细胞起作用,能分辨颜色和细节。电视系统中只考虑锥状细胞的视觉特性。4. 比较逐行扫描和隔行扫描的优缺点。对于相同行数的帧,逐行扫描光栅

3、的最大时间频率与将每帧分成两场的隔行扫描的最大时间频率之间有什么关系?最大垂直频率之间又有什么关系?优缺点比较: 隔行扫描主要应用于电视信号的发送与接收中。它的特点是把每秒传送25幅(帧)画面用每秒传送50次的方法来消除闪烁感,即一面传送两次,第一次扫描奇数行,第二次扫描偶数行,因而称为隔行扫描。采用这一制式的缺点是画面清晰度稍差,且有轻微的闪烁感。逐行扫描主要应用于计算机的显示器中。由于显示器不受电视台的发送方式限制,因而被广泛采用。逐行扫描就是每幅画面按1、2、3行的顺序扫描方式完成一幅画面。为了提高画面的清晰度,消除闪烁感,还可以增加扫描线数,目前显示器的扫描线数一般为768行,因而会感

4、到画面非常细腻、清晰。 逐行扫描DVD又称PDVD,首台样机于1998年问世,目前技术和产品均已成熟。它能够应用数字视频图像处理技术产生480线的真正的逐行扫描信号,再通过电视机的视频图形阵列(VGA)输入口或数字高清晰度电视接入口把信号送入彩电中,避免了普通DVD机隔行信号输出造成的失真或缺损,与逐行扫描电视、数字高清晰度电视配合使用可以获得胜似电影的美妙画质。5. 简述各种运动估计方法(基于光流、基于像素、基于块、基于网络、基于区域和全局)的优缺点。基于光流: 光流是空间运动物体在观测成像面上的象素运动的瞬时速度,光流场是指图像灰度模式的表面运动,是3D空间物体的运动在2D图像平面上的投影

5、。分为:1. 微分法:对光流约束方程通过Euler-Lagrange变换对得到PDE方程进行数值求解.2. 局部领域法:通过局部像素的邻域约束或张量结构来解决孔径问题,这类方法大多要通过最小二乘计算来完成.3. 区域匹配法,又称块匹配法:通过局部图像区域的邻域快速搜索找到最小误差或最大相关的匹配位置.缺点: 仅由一个基于亮度恒定的约束方程无法求解两个速度分量;图像中即使出现的小的干扰,会导致时空导数小的误差,进而引起速度估计产生较大的偏差。原始光流模型(HS)由于采用二次平滑项,因此在运动边缘、间断、遮挡等地方往往会造成过度平滑由于噪声、遮挡等干扰往往会在图像中产生异质点,严重破坏了HS光流方

6、程的初始假设条件,造成估计的光流很不准确在实际中,由于灰度变化以及速度场的变化都是不连续的,因而应用基本光流模型(HS),只能求解亮度变化小于1个象素的连续两帧图象,因此极大的限制了光流法的应用范围基于像素: 新的视频标准H.264为了获得更精确的运动向量和更高的压缩比,引入了分数像素运动补偿技术但同时也增加了运动补偿过程的复杂度。为了克服这一局限,根据相邻分数像素点之间高度相关的运动估计匹配误差和运动矢量方向,以及运动向量具有中心偏置的特性提出了一种新的1/4像素精度快速搜索算法(QAFSA)H.264中的分数运动估计能有效提高预测精度,但大大增加了计算复杂度。同整数运动估计一样,分数运动估

7、计存在两个主要问题,一是计算量大,二是存储访问量大。而本文提出的用于H.264/AVC的分像素运动估计的硬件实现方法能在全搜索块匹配算法的基础上,采用子块分解,利用1010整像素点阵列实现1/2像素精度和1/4像素精度的最佳匹配点的并行搜索,与其他实现方法相比在空间上具有更高的并行度,处理能力更高,不但减少了大量中间数据的存储与传输,节省了存储器资源,而且简化了数据流和控制流,使硬件实现简洁有效,非常适合高分辨率视频的分像素运动估计基于块: 在运动补偿视频编码系统中,它的优势是具有时间相关性的连续帧都实现了高压缩比,由一个参照系预测当前帧,只对预测误差和运动矢量进行编码和传送。运动估计(ME,

8、它的目的是找出连续帧之间的运动关系,在运动补偿视频编码框架中扮演重要角色。在很多ME算法中,块匹配运动估计(BMME)由于它很简单,被广泛地采用在很多视频压缩标准中.首先,不同于限制搜索步骤次数的算法,使候选项只能在一个固定大小的口内测试。ACS不限制搜索步骤的数量。因此ACS能使用不同大小的搜索窗口。从这一点上看,ACS能够适应不同的食品编码器的最大运动矢量长度。其次,大多数真实世界序列的运动矢量分布偏向零点。例如,对于推销员的序列,将近80块,可被视为静止和半静止 6 ACS在最小的十字形中开始搜索程序,由于多数的低运动块,搜索程序在前期的步骤中就被终止了。第三,有别于传统的固定模式,ME

9、的搜索点是均匀分布的,通过正确的用BDS当搜索点接近全局最小点的时候,所提出的算法将减少步长。搜索点的密度相对于其他区域而言是在一个较大的范围内接近全局最小和零点,因此,计算能力被有效的分配。最后,在实现ACS的时候,测试搜索点被记录以防止重叠计算。基于网络:目前基于网络的运动估计研究主要集中在三角形网路模型和四边形网络模型。三件性网格的运动等价于仿射运动模型。四边形网格模型则等价于双线性运动模型。一般来讲,视频帧内的网格节点数越多。网格的连线与物体的边界越吻合,运动估计越准确。但过多的网格节点会徒增运动参数和计算量,为了使用较少的网格节点,期望网格能自适应图像场景。基于区域和全局:全局运动估

10、计编码(GMC)是对视频序列作全局运动估计,并对全局运动矢量和全局运动补偿残差分别编码的过程。和传统的运动估计算法相比,GMC在有较大背景运动的情况下能够获得更低的码率。本提案提出了一种基于快速、鲁棒的全局运动估计方法1的低码率视频编码方案,实验结果表明,本方案在保持视频编码PSNR总体一致的情况下,能够减少1%-10%的码率6. 简述基于块节点的可变形块模型和基于网络的模型之间的相似点和区别。7. 与单分辨率方法相比,多分辨率估计的主要优点是什么?缺点是什么?优点:1、在较小分辨率层上,误差函数可以接近全局最小值,然后通过差值,可以为较大分辨率层求解奠定一个好的初始解。因此最后到达最大分辨率

11、是,运动场很可能接近最优解。2、在较小分辨率层上进行运动估计时,通常可以将搜索范围限制在较小的范围内,因此其计算量要比直接在最大分辨率上进行运动攻击时小。缺点:8. 考虑一个分辨率为720*480的视频。比较块尺寸为16*16的EBMA算法和三级HBMA算法所需要的计算量,其中假设运动范围为-32,,32。HBMA算法每层的搜索范围相同。为简单起见,忽略建立金字塔所需的计算,并假设只进行整数像素搜索。9. 简述视频运动分割的应用和方法。方法:1、帧间差分法。2、运动区域与背景的自动分离。3、获取运动目标实心区域。4、获取中间帧中的运动目标。应用:从压缩角度看,基于对象的视频压缩标准,如MPEG

12、-4,需要视频对象分割技术。步行道和高速交通可以用分割出的人和车的密度来区分开。通过对象分割,还可以检测到快速移动的汽车,路上障碍物,路面上其它的异常活动等。再加上行为识别的用户接口,就可以实现禁区、停车位、电梯都可以自动监控。交互式电视技术的发展,出现了对可交互的媒体的需要,例如交互式的广告,指用户收看广告时可选择感兴趣的商品,然后该商品的详细信息同时呈现在用户的面前。为了实现这一点,对视频的分割是必不可少的。10. 基于二维点跟踪中给定的状态转移方程和观察方程,试写出对应的Kalman滤波器方程。11.(1) 计算该信源的熵;(2) 用霍夫曼编码方法对此信源进行编码;(3) 计算平均码长,

13、并讨论霍夫曼编码的效率。12. 试比较预测编码和变换编码的优缺点。变换编码:变换是信号实现时域和变换域(频域)映射关系的运算 ,通常经正变换将信号在变换域分解,然后由反变换重建信号。变换通过将信号的能量集中在少数变换系数上给出信号的紧致表达,便于后续的压缩处理。 对于图像而言,采用符合人的视觉系统特征的量化方式,大多数高频系数在量化后会很小或者为零,量化后的变换系数矩阵变成了一个稀疏矩阵。 选择适当的扫描方式将二维矩阵表示的系数表示为一维向量,使得一维向量表示的系数具有零系数连续出现的特点,这样通过行程编码可以得到高压缩比。包括:kl变换、正交变换、余弦(DCT)变换 、离散余弦变换(DCT)

14、编码(DTC和JPEG两种算法,其中:尽管JPEG算法在过去和现在很多领域还发挥者巨大作用,但由于算法是将整体图像分割成小块(88或1616)进行变换,当压缩比高时由于数据损失,在块与块 之间就会出现分割的现象)。 预测编码:对于静止图像,由于相邻像素具有很强的相关性,这样当前像素的灰度(颜色)值可用前面已经出现的像素值进行预测,得到一个预测值,对实际值与预测值的差值进行编码, 对于视频信号,图像帧间的相关性具有很强的相关性,通过帧间预测,对残差图像编码。 预测编码是当今主流技术并且还会流行于未来。(包括:1、脉冲编码调制PCM(pulse code modulation) 输入是模拟信号,输

15、出是PCM样本,低通滤波器可以滤除掉指定频带以外的信号,波形滤波器可以理解为采样器。2、差分脉冲编码调制 DPCM (Differential pulse code modulation)。13. 简述帧内二维预测原理,如何确定最佳预测系数?帧内二维预测原理:在先前的H.26x系列和MPEG-x系列标准中,都是采用的帧间预测的方式。在H.264中,当编码Intra图像时可用帧内预测。显然,这种帧内预测不是在时间上,而是在空间域上进行的预测编码算法,可以除去相邻块之间的空间冗余度,取得更为有效的压缩。如何确定最佳预测系数: 14. 简述帧间预测块匹配法的原理,并说明为什么全搜索算法的运动估值效果

16、优于其他快速搜索算法?帧间预测块匹配法的原理:利用视频图像帧之间的相关性,即时间相关性,来达到图像压缩的目的。原因:15. 简述基于对象视频编码的原理。原理:视频图像数据有极强的相关性,也就是说有大量的冗余信息。其中冗余信息可分为空域冗余信息和时域冗余信息。压缩技术就是将数据中的冗余信息去掉(去除数据之间的相关性),压缩技术包含帧内图像数据压缩技术、帧间图像数据压缩技术和熵编码压缩技术。16. 简述可分级编码的方法、原理和应用。方法:空间可分级编码、时间可分级编码、信噪比可分级编码原理:分级视频编码的目标是对一个码流,不同的解码器可以根据自己的能力和所处的环境进行不同程度的解码,已获得相应质量的视频。应用:因特网上,如果一个视频流是采用分级编码得到的,则宽带是足够的用户可以下载所有的数据

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号