多媒体复习整理

上传人:子 文档编号:43559316 上传时间:2018-06-06 格式:DOC 页数:7 大小:438.50KB
返回 下载 相关 举报
多媒体复习整理_第1页
第1页 / 共7页
多媒体复习整理_第2页
第2页 / 共7页
多媒体复习整理_第3页
第3页 / 共7页
多媒体复习整理_第4页
第4页 / 共7页
多媒体复习整理_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《多媒体复习整理》由会员分享,可在线阅读,更多相关《多媒体复习整理(7页珍藏版)》请在金锄头文库上搜索。

1、多媒体的概念:以数字化为基础,能够对多种媒体信息进行采集、编码、存储、传输、处 理和表现,综合处理多种媒体信息并使之建立起有机的逻辑联系,集成为一个系统并能具 有良好交互性的技术。 数字视频的结构 基本单位是帧。 若干同一场景的帧构成镜头 若干镜头构成情节 若干情节构成故事(节目) 多媒体的三大特征:信息载体的多样性、交互性和集成性声音是由振动的声波所组成,在 任一时刻 t,声波可分解为一系列正弦波线性叠加: f(t)= An sin(nt+n) 其中, 称为基频或基音,它决定声音的高低;n 称为 的 n 次谐波分量或称为泛音, 与声音的音色有关; An 是振幅,表示声音的强弱;n 是 n 次

2、谐波的初相位。 通过规则时间间隔测出音波振动幅度从而产生一系列声音数据。这种测出数据方法称之 为采样,一秒内采样次数叫采样率。 采样的离散音频数据要转换成计算机能够表示 的数据范围,这个过程称之为量化。 量化后数字音频存储量计算公式音频数据存储量(字节)=采样率(Hz)量化位数(位) 声道数音频长度(秒)/8 变换公式(YUVRGB) Y = 0.299*R + 0.587*G+ 0.114*B; U =-0.169*R - 0.332*G+ 0.500*B; V = 0.500*R + 0.419*G - 0.081*B 变换公式(YIQRGB) Y =0.299*R+ 0.587*G+ 0

3、.114*B; I =0.211*R - 0.523*G+ 0.312*B; Q =0.596*R - 0.275*G - 0.322*B 压缩技术:(1)熵(平均信息量)编码(Entropy Coding) 熵编码是一种泛指那些不考虑被压缩信息的性质的编码和压缩技术。它是基于平均信息量 的技术把所有的数据当作比特序列,而不根据压缩信息的类型优化压缩。也就是说,平均 信息量编码忽略被压缩信息的语义内容。 熵编码分为:重复序列消除编码(含:消零、行程编码)、统计编码等。 (2)源编码(Source Coding) 源编码的冗余压缩取决于初始信号的类型、前后的相关性、信号的语义内容等。源编码比 严

4、格的平均信息量编码的压缩率更高。当然压缩的程度主要取决于数据的语义内容,比起 平信息量编码,它的压缩比更大。 源编码主要分为:预测编码、变换编码、向量量化等。 行程编码(Run Length Coding) 将数字中连续的“0”或文本中连续的空白用一个标识符(或 特殊字符)后跟数字 N(连续“0”的个数)来代替。 LZW 算法特点 LZW 压缩技术对于可预测性不大的数据具有较好的处理效果,常用于 GIF 格式的图像压 缩,其平均压缩比在 2:1 以上,最高压缩比可达到 3:1。 对于数据流中连续重复出现的字节和字串,LZW 压缩技术具有很高的压缩比。 除了用于图像数据处理以外,LZW 压缩技术

5、还被用于文本程序等数据压缩领域。LZW 压缩技术有很多变体,例如常见的 ARC、RKARC、PKZIP 高效压缩程序。 对于任意宽度和像素位长度的图像,都具有稳定的压缩过程。压缩和解压缩速度较快。 对机器硬件条件要求不高,在 Intel 80386 的计算机上即可 进行压缩和解压缩。 2.4.2 变换编码 输入图象 G 经正交变换 U 变换到频域空间,象素之间相关性下降,能量集中在变换域中少 数变换系数上,已经达到了数据压缩的效果。 对变换系数 A 中那些幅度大元素予以保留,其它数量多的幅度小的变换系数,全部当作零 不予编码,再辅以非线性量化,进一步压缩图象数据。 由于量化器存在,量化后变换系

6、数 A和 A 间必然存在量化误差,从而引起输入图象 G 和输出图象 G间存在误差。图中 U是 U 的逆变换。2.4.3 信息熵编码 又称为统计编码,它是根据信源符号出现概率的分布特性而进行的压缩编码。 基本思想: 在信源符号和码字之间建立明确的一一对应关系,以便在恢复时能准确地再 现原信号,同时要使平均码长或码率尽量小。 如 Huffman 编码、算术编码。 Huffman 定理 定理在变长编码中,对出现概率大的信源符号赋于短码字,而对于出现概率小的信源符 号赋于长码字。如果码字长度严格按照所对应符号出现概率大小逆序排列,则编码结果平均 码字长度一定小于任何其它排列方式。 Huffman 定理

7、是 Huffman 编码的理论基础 实现步骤 (1) 将信源符号按概率递减顺序排列; (2) 把二个最小概率相加作为新符号的概率, 并按(1) 重排; (3) 重复(1)、(2), 直到概率为 1; (4) 在每次合并信源时, 将合并的信源分别赋“0”和“1”(如概率大的赋“0”,概率小的赋“1”); (5) 寻找从每一信源符号到概率为 1 处的路径,记录下路径上的“1”和“0” ; (6)写出每一符号的“1” 、 “0”序列(从树根到信源符号节点)。 算术编码举例 初始 high=1,low=0, range=high-low, 一个字符编码后新的 low 和 high 按下式计算:low=

8、low+rangerangelow; high=low+rangerangehigh。 (1) 在第一个字符 e 被编码时, e 的 rangelow=0.2, rangehigh=0.5, 因此:low=0+10.2=0.2 high=0+10.5=0.5 range=high-low=0.5-0.2=0.3 此时分配给 e 的范围为0.2, 0.5) (2) 第二个字符 a 编码时使用新生成范围0.2,0.5), a 的 rangelow=0, rangehigh=0.2, 因此:low=0.2+0.30=0.2 high=0.2+0.30.2=0.26range=0.06 范围变成0.2

9、, 0.26) (3) 对下一个字符 i 编号, i 的 rangelow=0.5, rangehigh=0.6,range=0.06, 则:low=0.2+0.060.5=0.23 high=0.2+0.060.6=0.236 结果:用0.23, 0.236)表示数据串 eai,如果解码器知道最后范围是0.23, 0.236),它马上可 解得一个字符为 e, 然后依次得到唯一解 a、i, 最终得到 eai。算术编码的特点 不必预先定义概率模型,自适应模式具有独特的优点; 信源符号概率接近时,建议使用算术编码,这种情况下其效率高于 Huffman 编码(约 5%)。 JPEG 扩展系统采用。

10、4.2 JPEG 原理详细分析 JPEG 编码中主要涉及到的内容主要包括: 1. Color Model Conversion (色彩模型) 2. DCT (Discrete Cosine Transform 离散余弦变换) 3. 量化 4.”Z”字形编排 5. 编码 6.组成位数据流 4.2.2 离散余弦变换(DCT) 图像信号的频谱线一般在 0-6MHz 范围内,而且一幅图像内,包含了各种频率的分量。 但包含的大多数为低频频谱线,只在占图像区域比例很低的图像边缘的信号中才含有高频 的谱线。这个是对 JPEG 图像压缩的理论依据。 因此具体的方法就是,在对图像做数字处理时,可根据频谱因素分配

11、比特数:对包含信 息量大的低频谱区域分配较多的比特数,对包含信息量低的高频谱区域分配较少的比特数, 而图像质量并没有可察觉的损伤,达到数据压缩的目的。 将原始图像这个色彩空间域,转换为频谱域,怎么转呢,这个就用到了数学上的离散余 弦变换,即 DCT(Discrete Cosine Transform)变换。首先图像全部减去-128,使范围变为 -128 到 1274.2.3 量化 量化过程实际上就是对 DCT 系数的一个优化过程。它是利用了人眼对高频部分不敏感的 特性来实现数据的大幅简化。 量化过程实际上是简单地把频率领域上每个成份,除以一个对于该成份的常数,且接着 四舍五入取最接近的整数。

12、以这个结果来说,经常会把很多高频率的成份四舍五入而接近 0,且剩下很多会变成小 的正或负数。 整个量化的目的是减小非“0”系数的幅度以及增加“0”值系数的数目。 量化是图像质量下降的最主要原因。 这是整个过程中的主要有损运算。 4.2.5.3 Huffman 编码 范式 Huffman 编码即 Canonical Huffman Code,现在流行的很多压缩方法都使用了范式 哈夫曼编码技术,如 GZIB、ZLIB、PNG、JPEG、MPEG 等。 在直流 DC 系数经过上面的 DPCM 编码,交流 AC 系数经过 RLE 编码后,用 Huffman 编码来处理 DC 的符号 1 和 AC 的符

13、号 1。I 帧特点 它是一个全帧压缩编码帧。它将全帧图像信息进行 JPEG 压缩编码及传输。 解码时仅用 I 帧的数据就可重构完整图像。I 帧描述了图像背景和运动主体的详情。 I 帧不需要参考其他画面而生成。 I 帧是 P 帧和 B 帧的参考帧(其质量直接影响到同组中以后各帧的质量) 。 I 帧是帧组 GOP 的基础帧(第一帧) ,在一组中只有一个 I 帧。 I 帧不需要考虑运动矢量。 I 帧所占数据的信息量比较大。 P 帧特点P 帧是 I 帧后面相隔 12 帧的编码帧。 P 帧采用运动补偿的方法传送它与前面的 I 或 P 帧的差值及运动矢量(预测误差) 。 解码时必须将 I 帧中的预测值与预

14、测误差求和后才能重构完整的 P 帧图像。P 帧属于前向预测的帧间编码。它只参考前面最靠近它的 I 帧或 P 帧。 P 帧可以是其后面 P 帧的参考帧,也可以是其前后的 B 帧的参考帧。 由于 P 帧是参考帧,它可能造成解码错误的扩散。 由于是差值传送,P 帧的压缩比较高。 2.4.4 MPEG 解码 从编码的原理可知,P 帧解码需以 I 帧为基础,而 B 帧又以 I,P 为基础。解码时,先解出 I 帧并送帧寄存器,然后根据编码过程的记录依次解出 P 帧也送帧寄存器,由 I、P 再解出 B 帧同样送帧寄存器。等到各帧都解完后,从帧寄存器中依次取出各种帧图进行重新排列 即可得到一组帧序列。 8.1.2 光存储系统的技术指标

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号