第7章多媒体技术－金锄头文库

资源描述

《第7章多媒体技术》由会员分享，可在线阅读，更多相关《第7章多媒体技术（57页珍藏版）》请在金锄头文库上搜索。

1、计算机科学与工程系计算机科学与工程系07 - 1/57第七章第七章多媒体技术多媒体技术本章主要介绍本章主要介绍多媒体计算机技术概念多媒体计算机技术概念多媒体计算机系统多媒体计算机系统音频信息的获取和处理音频信息的获取和处理图像信息的获取和处理图像信息的获取和处理多媒体数据压缩的主要方法多媒体数据压缩的主要方法计算机科学与工程系计算机科学与工程系07 - 2/57 感觉媒体感觉媒体人类感知客观环境人类感知客观环境 ( (听觉、视觉、触觉听觉、视觉、触觉) ) 表示媒体表示媒体信息的表达特征信息的表达特征 (ASCII(ASCII、图像、声音、视频等编码、图像、声音、视频等编码) ) 显示媒体显

2、示媒体输入输出信息输入输出信息 ( (键盘、鼠标、显示器、打印机等键盘、鼠标、显示器、打印机等) ) 存储媒体存储媒体传输的物理载体传输的物理载体 ( (光纤、电缆、微波无线链路、红光纤、电缆、微波无线链路、红外无线链路等外无线链路等) ) 传输媒体传输媒体保存表示媒体的介质保存表示媒体的介质 ( (软盘、硬盘、光盘等软盘、硬盘、光盘等) )7.1 多媒体计算机技术概述多媒体计算机技术概述7.1.1 7.1.1 多媒体计算机的概念多媒体计算机的概念ITU对媒体分类对媒体分类计算机科学与工程系计算机科学与工程系07 - 3/577.1 多媒体计算机技术概述多媒体计算机技术概述2.为为传传送送和和

3、表表达达感感觉觉媒媒体体而而人人为为研研究究出出来来的的媒媒体体 (如如ASCII、图图像、声音、视频编码等像、声音、视频编码等)1.人人类类通通过过感感观观直直接接感感知知的的信信息息 (文文字字、声音、图像等声音、图像等)3.输输入入和和输输出出信信息息的的媒媒体体 (如如键键盘盘、鼠鼠标标、显显示示器器、打印机等打印机等)4.存存储储表表示示媒媒体体的的介介质质 (软软盘盘、硬硬盘盘、光盘等光盘等)5.传传输输的的物物理理载载体体 (光纤、电缆等光纤、电缆等)计算机科学与工程系计算机科学与工程系07 - 4/57 通常所指的多媒体就是文字、声音、图像、图通常所指的多媒体就是文字、声音、图

4、像、图形、动画、视频等各种媒体在计算机统一管理下的形、动画、视频等各种媒体在计算机统一管理下的有机结合，能实现加工、变换，集成为系统并具有有机结合，能实现加工、变换，集成为系统并具有交互功能，产生优于多种媒体单独存在的效果。交互功能，产生优于多种媒体单独存在的效果。多媒体计算机技术多媒体计算机技术计算机综合处理多种媒体信息计算机综合处理多种媒体信息(文本、图形、文本、图形、图像、音频、视频和动画图像、音频、视频和动画)，使多种信息建立逻辑，使多种信息建立逻辑连接，集成为一个系统且具有交互性。连接，集成为一个系统且具有交互性。7.1 多媒体计算机技术概述多媒体计算机技术概述计算机科学与工程系计

5、算机科学与工程系07 - 5/577.1.2 多媒体技术的发展历史多媒体技术的发展历史1984年，年，Apple公司推出公司推出Machintosh图形操作系统。图形操作系统。1985年，世界上第一台多媒体计算机问世。年，世界上第一台多媒体计算机问世。1986年，推出光盘系统年，推出光盘系统1990年，多媒体个人计算机协会制定年，多媒体个人计算机协会制定MPC1标准。标准。1995年，年，Windows95操作系统问世。操作系统问世。7.1 多媒体计算机技术概述多媒体计算机技术概述 Apple计算机计算机(1984)Commodore Amiga系统系统计算机科学与工程系计算机科学与工程系07

6、 - 6/57多媒体特点多媒体特点多样性：不只是单一媒体，必须包括图文声像多种媒体。集成性：不是多种媒体的简单收集，必须有机集成系统。交互性：实现人机互动，用户可以根据需要来使用系统。多媒体关键技术多媒体关键技术音频视频信号的获取技术多媒体数据的压缩编码和解码技术音频视频数据的实时处理和特技音频视频数据的输出技术7.1.3 多媒体技术的特点和关键技术多媒体技术的特点和关键技术7.1 多媒体计算机技术概述多媒体计算机技术概述计算机科学与工程系计算机科学与工程系07 - 7/577.1.4 多媒体技术的发展和应用多媒体技术的发展和应用7.1 多媒体计算机技术概述多媒体计算机技术概述形象教学形象

7、教学仿真工艺过程仿真工艺过程模拟交互过程模拟交互过程电子教案、教学电子教案、教学网络多媒体教学网络多媒体教学教育教育（形象教学、模拟展示）（形象教学、模拟展示）InternetInternet国际互联网国际互联网网络多媒体技术网络多媒体技术网络远程诊断网络远程诊断网络远程操作网络远程操作 ( (手术手术) )医疗医疗（远程诊断、远程手术）（远程诊断、远程手术）生物形态模拟生物形态模拟生物智能模拟生物智能模拟人类行为智能模拟人类行为智能模拟人工智能模拟人工智能模拟（生物、人类智能模拟）（生物、人类智能模拟）商业广告商业广告（特技合成、大型演示）（特技合成、大型演示）影视商业

8、广告影视商业广告公共招贴广告公共招贴广告大型显示屏广告大型显示屏广告平面印刷广告平面印刷广告电视电视/ /电影电影/ /卡通混编特技卡通混编特技三维成像模拟特技三维成像模拟特技演艺界演艺界MTVMTV特技制作特技制作仿真游戏、赌博游戏仿真游戏、赌博游戏影视娱乐业影视娱乐业（电影特技、变形效果）（电影特技、变形效果）计算机科学与工程系计算机科学与工程系07 - 8/577.1 多媒体计算机技术概述多媒体计算机技术概述 (1) 多媒体技术智能化多媒体技术智能化即把人工智能领域某些研究课题和多媒体计算机技术很好地结合。 (2) 多媒体信息实时处理和压缩编码算法芯片化多媒体信息实时处理

9、和压缩编码算法芯片化把多媒体信息实时处理和压缩编码算法直接放置到CPU芯片中，从而大大改善多媒体计算机的性能指标。 (3) 虚拟现实技术虚拟现实技术是指运用多种技术综合形成一种模拟现实环境的人造环境，用户在该环境中通过五官和大脑的亲自体验和活动参与到该人造的、虚拟的环境中，可以与之交互。让你感觉到如同置身于真实世界一样。它是多媒体技术的最高境界。 7.1.5 未来多媒体技术的发展未来多媒体技术的发展计算机科学与工程系计算机科学与工程系07 - 9/577.2.1 7.2.1 多媒体计算机硬件系统多媒体计算机硬件系统7.2 多媒体计算机系统多媒体计算机系统计算机科学与工程系计算机科学与工程系

10、07 - 10/577.2 多媒体计算机系统多媒体计算机系统(1) 基本硬件设备基本硬件设备光盘存储器：光盘存储器：由光盘和光盘驱动器构成。光盘用于存储数据，光盘驱动器用于读写光盘中的数据。音频卡：音频卡：又名“声卡”，主要用于处理声音，是多媒体计算机的基本配置。不过，目前许多计算机的主板上都集成了声卡的功能，声卡不再以单独形式存在。7.6 音频卡的基本原理计算机科学与工程系计算机科学与工程系07 - 11/577.2 多媒体计算机系统多媒体计算机系统音频卡的主要作用音频卡的主要作用A/D(模模/数数)转换转换将作为模拟量的自然声音经过变换，转化成数字化的声音，然后以文件形式保存在计算机中

11、，可以利用声音处理软件对其进行加工和处理。D/A(数数/模模)转换转换把数字化的声音转换成作为模拟量的自然声音。转换后的声音输出到声音还原设备(如耳机、有源音箱、音箱放大器) 。输入、输出功能输入、输出功能利用输入端子，将模拟信号引入声卡；将数字信号转换成模拟信号送到输出端子，驱动音响设备发出声音。计算机科学与工程系计算机科学与工程系07 - 12/57音频卡的主要接口音频卡的主要接口总线(Bus) 线路输入(Line in)话筒输入(Mic in) 线路输出(Line out)扬声器输出(Speaker Out) 游戏棒/MIDI(Joystick/MIDI)7.2 多媒体计算机系统多媒体计

12、算机系统计算机科学与工程系计算机科学与工程系07 - 13/57声卡与外部设备的连接示意图声卡与外部设备的连接示意图音箱音箱2 2、麦克风输入、麦克风输入3 3、扬声器输出、扬声器输出4 4、MIDI/MIDI/操纵杆端口操纵杆端口外部音频设备外部音频设备麦克风麦克风操纵杆操纵杆MIDI声音装置声音装置1 1、线性输入、线性输入5 5、音量调节旋钮、音量调节旋钮7.2 多媒体计算机系统多媒体计算机系统计算机科学与工程系计算机科学与工程系07 - 14/57音频卡中的关键部件数字信号处理器DSP：是声卡的核心部件，用于管理所有声音的输入输出以及音频信号的模/数(A/D)转换和数/模(D/A)转

13、换。混合信号处理器：可以选择输入一个声源或将几个不同声源进行混合录音。音乐合成器：主要用于MIDI音乐文件的播放。7.2 多媒体计算机系统多媒体计算机系统计算机科学与工程系计算机科学与工程系07 - 15/577.2 多媒体计算机系统多媒体计算机系统(2)扩展设备: 具有代表性的扩展设备有：触摸屏、视频卡、扫描仪、数码相机、数字摄像机、各种彩色打印机、彩色投影仪等。数码照相机数码照相机彩色扫描仪彩色扫描仪数码摄像机数码摄像机触触摸摸屏屏彩色打印机彩色打印机计算机科学与工程系计算机科学与工程系07 - 16/57 触触摸摸屏屏：属于输入设备，可通过手指直接在屏幕上指点及触及屏幕上的菜单、光

14、标、接钮等。由传感器、控制部件、驱动程序组成。当用手指或其它设备触摸安装在计算机显示器前面的触摸屏时，所摸到的位置以坐标形式被触摸屏控制器检测到，并通过接口送到CPU，从而确定用户所输入的信息。触摸检测装置触摸检测装置触摸检测装置触摸检测装置触摸屏控制卡触摸屏控制卡触摸屏控制卡触摸屏控制卡驱动程序驱动程序驱动程序驱动程序电缆电缆电缆电缆7.2 多媒体计算机系统多媒体计算机系统计算机科学与工程系计算机科学与工程系07 - 17/57 视视频频卡卡：一种专门用于对视频信号进行实时处理的设备。视频卡插在主机板的扩展槽内，可以对视频信号进行数字化转换、编辑和处理，以及保存数字化文件

15、。通常使用的视频采集卡可以接收来自视频输入端的模拟视频信号(录像机、电视机、LD影碟机等)，对该信号进行数字化处理，然后压缩编码成数字视频。大多数视频卡都具备硬件压缩的功能。此外，还有一种比较流行的视频采集卡，我们称之为IEEE1394数字视频采集卡。它主要的作用是将DV视频数据从数码摄像机传送到电脑的硬盘中，和模拟采集不同，它在传送数据的过程中没有任何质量损失。7.2 多媒体计算机系统多媒体计算机系统视视频卡频卡数字视频采集卡数字视频采集卡计算机科学与工程系计算机科学与工程系07 - 18/57 扫描仪工作原理：把原件面朝下放在扫描仪的玻璃台上，扫描仪内发出光照射原件，反射光线经光学镜

16、面导向后，照射到CCD的光敏器件上。来自CCD的电量送到模数转换器中，电压转换成代表每个像素色调或颜色的数字值。步进电机驱动扫描头沿平台作微增量运动,每移动一步，即获得一行像素值。扫描样张扫描样张扫描样张扫描样张光电转换器光电转换器光电转换器光电转换器导轨导轨导轨导轨光源光源光源光源数字信号数字信号数字信号数字信号输出输出输出输出识别反射识别反射识别反射识别反射光线光线光线光线7.2 多媒体计算机系统多媒体计算机系统扫扫描描仪仪：是一种图形输入设备。配合适当的应用软件后，扫描仪还可以进行中、英文智能识别。计算机科学与工程系计算机科学与工程系07 - 19/57数码照相机：数码照相机：一种数字

17、成像设备。数码相机采用CCD作为记录图像的光敏介质，CCD实际上是一块布满光敏元件即电荷耦合器的感光板，CCD是通过光照的不同引起的电荷分布的不同来记录被摄入的物体。它将光信号转换成电信号，然后电信号再转换成数字信号并进行编码、压缩等处理，最后把得到的压缩数字图像保存在存储器中。7.2 多媒体计算机系统多媒体计算机系统计算机科学与工程系计算机科学与工程系07 - 20/57数码相机的工作原理数码相机的工作原理用数码相机拍照时，进入照相机镜头的光线聚焦在CCD上。当照相机判定已经聚集了足够的电荷时，就“读出”在CCD单元中的电荷，并传送到模数转器中，把每一个模拟电压转换成二进制数字信息。从模

18、数转换器输出的数据传送到数字信号理器中进行编码、压缩后存储在照相机的存储中。数字信号数字信号数字信号数字信号译码器译码器存储介质存储介质数据接口数据接口CCDCCD7.2 多媒体计算机系统多媒体计算机系统计算机科学与工程系计算机科学与工程系07 - 21/57多多媒媒体体设设备备驱驱动动程程序序，用于在启动操作系统时把设备的状态、型号、工作模式等信息提供给操作系统，并驻留在内存储器，供系统调用。多媒体产品制作软件多媒体产品制作软件，主要包括图像、视频、音频的编辑制作。多媒体平台软件多媒体平台软件，用于多媒体素材的组合。工具软件工具软件，用于加工和处理数据，如压缩、加密等。应应用用软软件件，

19、包括Windows系统提供的多媒体软件、动画播放软件、声音播放软件、光盘刻录软件等。7.2 多媒体计算机系统多媒体计算机系统7.2.2 7.2.2 多媒体计算机软件系统多媒体计算机软件系统计算机科学与工程系计算机科学与工程系07 - 22/577.3.1 7.3.1 数字音频基本概念数字音频基本概念7.3 音频信息的获取和处理音频信息的获取和处理声音是机械振动。振动越强，声音越大，话筒把机械振动转换成电信号，模拟音频技术中是以模拟电压的幅度表示声音强弱。次声波次声波次声波次声波人耳可听范围人耳可听范围人耳可听范围人耳可听范围超声波超声波20Hz 2020,000Hz20,000Hz 20,0

20、00Hz模模拟拟音音频频信信号号：声音波形在时间和幅度上都是连续的。一般用不同的电压表示。模拟音频信息是个连续的量，不能由计算机直接处理，必须将其数字化处理。数字音频信号：数字音频信号：把表示声音强弱的模拟电压用数字表示。计算机科学与工程系计算机科学与工程系07 - 23/577.3.2 7.3.2 音频信息的数字化音频信息的数字化7.3 音频信息的获取和处理音频信息的获取和处理模拟信号的数字化过程模拟信号的数字化过程100101100011101 数字音频信号是由模拟声音经采样、量化和编经采样、量化和编码码得来的。其信号在时间和幅度上都用离散的数字序列表示。计算机科学与工程系计算机科学与

21、工程系07 - 24/577.3 音频信息的获取和处理音频信息的获取和处理每隔一个时间间隔在模拟声音的波形上取一个幅度值，把时间上的连续信号变成时间上的离散信号。采样频率是指计算机每秒钟采集多少个声音样本。(1) 采样采样时间上的离散时间上的离散计算机科学与工程系计算机科学与工程系07 - 25/577.3 音频信息的获取和处理音频信息的获取和处理采样频率采样频率声音信号最高频率声音信号最高频率 2奈奎斯特(Nyquist)采样定理提高采样频率，单位时间所得到的振幅值就会更多，即采样频率越高，对于原声音曲线的模拟就越精确。当今主流声卡的采样频率一般可分为22.05KHz、44.1KHz

22、、48KHz三个等级，22.05只能达到FM广播的声音品质，44.1KHz则是理论上的CD音质界限，48KHz则更加精确一些。如果采用更高的采样频率，还可以做出DVD的音质。计算机科学与工程系计算机科学与工程系07 - 26/577.3 音频信息的获取和处理音频信息的获取和处理量化的过程是量化的过程是将采样后的信号按整个声波的幅度划分将采样后的信号按整个声波的幅度划分成有限个区段成有限个区段(量化间距量化间距) ，然后把落入某个间距内的值归，然后把落入某个间距内的值归为一类，并赋予相同的量化值。为一类，并赋予相同的量化值。用一定位数的二进制表示的有限个整数粗略表示声音幅度的差别。(2) 量

23、化量化幅度上的离散幅度上的离散计算机科学与工程系计算机科学与工程系07 - 27/577.3 音频信息的获取和处理音频信息的获取和处理失真在采样过程中是不可避免的，如何减少失真呢？可以直观地看出，当我们采用更高的采样频率。增加量化精度，就可以减少失真的程度。但由此得到的数字音频信号数据量也就越大。计算机科学与工程系计算机科学与工程系07 - 28/577.3 音频信息的获取和处理音频信息的获取和处理由于经采样和量化后的音频信号数据量很大，所以一般要先对数字化的音频信息进行压缩和编码进行压缩和编码后在计算机内传输和存储。在播放这些声音时，需要经解码器将二进制编码恢复成原来的声音信号播放。

24、(3) 编码编码计算机科学与工程系计算机科学与工程系07 - 29/577.3 音频信息的获取和处理音频信息的获取和处理(1) WAV文件格式：文件格式：Microsoft公司的波形音频文件格式。来源于对声音模拟波形采样，量化、编码。这种文件最大的缺点是占用存储空间大。适用领域：音频原始素材保存。该格式是通用音频格式。 7.3.3 7.3.3 数字音频文件格式数字音频文件格式未压缩的波形音频文件WAV和CD音频光盘的存储容量计算如下：存储量存储量=采样频率采样频率采样量化位数采样量化位数声道数声道数时间时间/8 例：采样频率为44.1KHz，采样数据量化位数(或称采样精度)为16位、双声

25、道，一张 60分钟的 CD唱片所占存储容量为： 44.110001626060/8=635040000(B) 606(M)计算机科学与工程系计算机科学与工程系07 - 30/577.3 音频信息的获取和处理音频信息的获取和处理 (2) MP3文文件件格格式式：采用1:101:20压缩率制作的数字音频文件。必须经过解压缩才能播放，数据量小。 (3) RA文文件件格格式式：最早的因特网流媒体音频，音质相对较差。特点是可在低的带宽下在网上实时播放。 (4) WMA文文件件格格式式：因特网流媒体音频，用于在互联网上播放的压缩音频文件。质量优于RA。 (5) MID文文件件

26、格格式式：多媒体计算机产生声音的特殊方式，记录有限乐器的音序组合。是一种通过电子乐器弹奏，数字化合成的音频文件，占用空间很小。 (6) APE文文件件格格式式：是一种音频无损压缩格式，APE文件大小可压缩到传统无损格式 WAV 文件的一半；而在音质上超越一般的 MP3，达到和 CD 相同的音质。 (7) AIF文件格式：文件格式：Apple计算机的波形音频文件格式。计算机科学与工程系计算机科学与工程系07 - 31/577.4.1 7.4.1 图像与图形的区别图像与图形的区别7.4 图像信息的获取和处理图像信息的获取和处理图图像像由由像像素素点点构构成成，像像素素是是组组成成图图像像最最基基

27、本本的的元元素素，每个像素点用若干个二进制位进行描述。图像通常用于表现自然景观、人物、动物、植物和一切引起人类视觉感受的事物。图图形形指指经经过过计计算算机机运运算算而而形形成成的的抽抽象象化化结结果果，由由具具有有方方向向和和长长度度的的矢矢量量线线段段构构成成。图形使用坐标、运算关系以及颜色数据进行描述，因此把图形叫做“矢量图”。图形的数据量小，常用于表现直线、曲线、复杂运算曲线以及由各种线段围成的图形，不适于描述色彩丰富、复杂的自然影像。计算机科学与工程系计算机科学与工程系07 - 32/577.4.2 7.4.2 颜色的基本概念颜色的基本概念7.4 图像信息的获取和处理图像信息的获

28、取和处理(1) 颜色的基本描述颜色的基本描述亮度亮度色调色调饱和度饱和度色彩的明暗程度亮度对饱和度的影响很大颜色的种类，与颜色的波长有关。色彩的纯度黑、白、灰没有纯度纯度最高的颜色计算机科学与工程系计算机科学与工程系07 - 33/577.4 图像信息的获取和处理图像信息的获取和处理 RGB RGB 电脑彩色电脑彩色RedBlueGreen0 255 灰阶灰阶0 255 灰阶灰阶0 255 灰阶灰阶自然界常见的各种彩色光都可以由红(R)、绿(G)、蓝(B)三种颜色光按不同比例相配而成。同样，绝大多数颜色也可以分解成红、绿、蓝三种色光，这就是色彩学中最基本的原理三基色原理。RGB相加混色原理

29、相加混色原理把三种基色光按不同比例相加，称之为相加混色。对于发出的光，可有红、绿、蓝三个主要光波，当以不同比例结合时便产生一个完整的光谱，包含所有的色彩。计算机科学与工程系计算机科学与工程系07 - 34/577.4 图像信息的获取和处理图像信息的获取和处理(2) 颜色空间表示颜色空间表示 RGB色色彩彩空空间间：由红(Red)、绿(Green)、蓝(Blue) 3种颜色光按不同比例相配而成。主要用于计算机显示。 CMY色色彩彩空空间间：三基色是青 (Cyan)、品红(Magenta)和黄(Yellow)，简称为CMY。适用于彩色印刷或彩色打印。计算机科学与工程系计

30、算机科学与工程系07 - 35/577.4 图像信息的获取和处理图像信息的获取和处理 YUV和和YIQ色色彩彩空空间间：彩色电视系统中常采用的颜色空间表示。欧洲和中国等PAL制采用YUV，Y表示亮度信号，U和V表示色差信号R-Y和B-Y。美国和日本等NTSC采用YIQ，Y仍为亮度信号，IQ表示色差信号。 HSI色色彩彩空空间间：Hue表示色调，Saturation表示颜色的饱和度，Intensity表示光的强度。PAL彩色电视制式中采用YUV模型来表示彩色图像计算机科学与工程系计算机科学与工程系07 - 36/577.4.3 7.4.3 图像信息的数字化图像信息的数字化7.4 图像信息的获取和

31、处理图像信息的获取和处理 88 像素像素 1616像素像素 3232像素像素 6464像素像素 (1) 采样采样将将二二维维空空间间上上模模拟拟的的连连续续亮亮度度或或彩彩色色信信息息转转化化为为一一系系列列有有限限的的离离散散数数值值来来表表示示。具体的做法就是对图像在水平方向和垂直方向上等间隔地分割成矩形网状结构，每个矩形网格称为像素点。像素总数就是图像的分辨率。计算机科学与工程系计算机科学与工程系07 - 37/577.4 图像信息的获取和处理图像信息的获取和处理 (2)量化量化对对采采样样的的每每个个离离散散点点的的像像素素的的灰灰度度或或颜颜色色样样本本进进行行数数字字化化，是是

32、将将采采样样值值划划分分成成各各种种等等级级，用用一一定定位位数数的的二二进进制制数数来来表示采样的值。表示采样的值。量化位数越大，则越能真实地反映原有图像的颜色。但得到的数字图像的容量也越大。在量化时表示量化的色彩值(或灰度值)所需的二进制位数称为量化字长。一般可用8位、16位、24位或更高的量化字长来表示图像的颜色。(3)编码编码图图像像编编码码是是按按一一定定的的规规则则，将将量量化化后后的的数数据据用用二二进进制制数据存储在文件中。数据存储在文件中。计算机科学与工程系计算机科学与工程系07 - 38/577.4 图像信息的获取和处理图像信息的获取和处理(1) 图像分辨率图像分辨率

33、图像由像点构成，而像点的密度决定了分辨率的高低。分辨率的单位是为每英寸显示的像点数。7.4.4 7.4.4 图像的属性图像的属性(2) 颜色数量和颜色深度颜色数量和颜色深度颜色深度是指在某一颜色系统中每个颜色所使用的二进制位数，而颜色数量是指该颜色系统中共有多少种颜色。颜色深度颜色深度颜色总数颜色总数图像名称图像名称12单色图像单色图像416索引索引16 色图像色图像8256索引索引256 色图像色图像1665536HIColor 图像图像2416672216True Color 图像图像计算机科学与工程系计算机科学与工程系07 - 39/577.4 图像信息的获取和处理图像信息的获取和处

34、理当当某某个个图图像像的的颜颜色色深深度度达达到到或或高高于于24bit时时，其其颜颜色色数数量量已已经经足足够够多多，且且图图像像的的色色彩彩和和表表现现力力非非常常强强，基基本本上上还还原了自然影像，习惯上把这种图像叫做原了自然影像，习惯上把这种图像叫做“真彩色图像真彩色图像”。 32级灰度级灰度 16级灰度级灰度 8级灰度级灰度 4级灰度级灰度 2级灰度级灰度颜色深度为颜色深度为8位的图像（位的图像（256种颜色）种颜色）颜色深度为颜色深度为24位的图像（位的图像（16万种颜色）万种颜色）计算机科学与工程系计算机科学与工程系07 - 40/577.4 图像信息的获取和处理图像信息

35、的获取和处理对于同一幅数字图像，采用不同的文件格式保存时，其图像数据量、色彩数量和表现力会有不同。7.4.5 7.4.5 数字图像的文件格式与数据量数字图像的文件格式与数据量 (1) 图像文件的格式图像文件的格式文件格式文件格式分辨率分辨率颜色深度颜色深度( (最大最大) )说明说明BMP 任意任意 32bit Windows用位图，鲜艳、细腻、但尺寸大用位图，鲜艳、细腻、但尺寸大GIF 96dpi 8bit 256索引颜色，尺寸小，有小动画效果索引颜色，尺寸小，有小动画效果JPEG 任意任意 32bit JPEG压缩文件，质量高、尺寸小、略失真压缩文件，质量高、尺寸小、略失真PSD 任意任

36、意 24bit Photoshop专用，图像细腻专用，图像细腻PCD 任意任意 32bit Kodak照片照片CD文件文件TIFF 任意任意 24bit 通用图像文件，用于扫描仪、通用图像文件，用于扫描仪、OCR系统系统WMF 96dpi 24bit Windows的剪贴画文件的剪贴画文件(矢量图矢量图)计算机科学与工程系计算机科学与工程系07 - 41/577.4 图像信息的获取和处理图像信息的获取和处理图像文件数据量的单位是字节，数据量大是图像文件的显著特点，即使采用数据压缩算法进行处理，其数据量也是非常可观的。一幅未经压缩的数字图像的数据量大小计算如下图像数据量大小图像数据量大小 =

37、像素总数像素总数图像颜色深度图像颜色深度8 例如：一幅 640480 ，256 色图像为 64048088 = 307200 (字节)(2) 图像文件的数据量图像文件的数据量像素点个数像素点个数256=28个不同的个不同的色彩，用色彩，用 8位位表表示示位转换为字位转换为字节节计算机科学与工程系计算机科学与工程系07 - 42/577.4.6 图像信息的获取方法图像信息的获取方法7.4 图像信息的获取和处理图像信息的获取和处理光电转换器数字信号输出(1) 使用数码相机拍照使用数码相机拍照利用数码相机或者数码摄像机直接拍摄自然影像，中间环节少，是最简单的获取图像的手段。 (2) 使用扫描仪扫

38、描使用扫描仪扫描在扫描图像时，应根据图像的使用场合，选择合适的扫描分辨率进行。分辨率的数值越大，图像的细节部分月清晰，但是图像的数据量会越大。 (3) 使用现成图像使用现成图像可以从正式出版的图片库光盘上获得或从互联网络上获得。计算机科学与工程系计算机科学与工程系07 - 43/577.5.1 动画的概念和发展历史动画的概念和发展历史7.5 动画与视频信息动画与视频信息光电转换器数字信号输出动动画画由由多多幅幅画画面面组组成成，当当画画面面快快速速连连续续地地播播放放时时，由由于人类眼睛存在于人类眼睛存在“视觉滞留效应视觉滞留效应”而产生动感。而产生动感。所谓“视觉滞留效应”是指当被

39、观察的物体消失后，物体仍在大脑视觉神经中停留短暂的时间。人类的视觉滞留时间约为1/24s。换言之，如果每秒快速更换24个画面或更多的画面，那么，前一个画面在脑海中消失之前，下一个画面已经映入眼帘，大脑感受的影像是连续的。计算机科学与工程系计算机科学与工程系07 - 44/577.5.2 电脑动画电脑动画7.5 动画与视频信息动画与视频信息扫描样张光电转换器数字信号输出电脑动画有两大类，一类是帧动画，另一类是矢量动画。帧动画帧动画以帧作为动画构成的基本单位，很多帧组成一部动画片。帧动画借鉴传统动画的概念，一帧对应一个画面，每帧的内容不同。当连续演播时，形成动画视觉效果。矢量动画矢量动画

40、经过电脑计算而生成的动画，其画面只有一帧，主要表现变化的图形、线条、文字和图案。矢量动画通常采用编程方式和某些矢量动画制作软件来完成。计算机科学与工程系计算机科学与工程系07 - 45/577.5.3 制作动画的设备和软件制作动画的设备和软件7.5 动画与视频信息动画与视频信息扫描样张光电转换器数字信号输出制作动画需要一台多媒体电脑，性能指标没有特殊要求，应尽可能采用高速CPU，足够大的内存容量，以及大量的硬盘空间。动画制作软件具备大量用于绘制动画的编辑工具和效果工具，还有用于自动生成动画、产生运动模式的自动动画功能。 Flash网页动画软件。 3D Studio Max三维造型和动画软件

41、。计算机科学与工程系计算机科学与工程系07 - 46/577.5.4 视频处理视频处理7.5 动画与视频信息动画与视频信息扫描样张光电转换器数字信号输出视频和动画没有本质的区别，只是二者的表现内容和使用场合有所不同。视频来自于数字摄像机、数字化的模拟摄像资料、视频素材库等，常用于表现真实场景。动画则借助于编程或动画制作软件生成一系列景物画面。对于数字化的视频信息，则需要专门的工具软件进行编辑和处理。视频信息具有实时性强、数据量大、对计算机的处理能力要求高等特点。计算机科学与工程系计算机科学与工程系07 - 47/577.5.4 动画和视频信息常见的文件格式动画和视频信息常见的文件格式7

42、.5 动画与视频信息动画与视频信息扫描样张光电转换器数字信号输出(1) GIF格式格式用于网页的帧动画文件格式。GIF格式由两种类型，一种是固定画面的图像文件，256色，分辨率固定为96dpi ；另一种是多画面动画文件，同样采用256色，96dpi。(2) SWF格式格式使用Flash软件制作的动画文件格式。该格式的动画主要在网络上演播，特点是数据量小，动画流畅，但不能进行修改和加工。(3) AVI格式格式通用的视频文件格式。该视频格式兼容好、调用方便、图像质量好，但缺点是文件体积过于庞大。计算机科学与工程系计算机科学与工程系07 - 48/577.5 动画与视频信息动画与视频信息扫描样

43、张光电转换器数字信号输出(4) DV AVI格式格式数码AVI格式。它不同于传统AVI格式，目前非常流行的数码摄像机就是使用这种格式记录视频数据的。(5) DivX格式格式采用DivX编码的AVI格式。它将DVD的视频部分通过特殊的DivX编码压缩处理成.avi格式文件。它可把DVD压缩为原来的10%，质量接近DVD光盘。 (6) MPEG格式格式用 MPEG算法压缩得到的视频文件。 VCD是用MPEG-1格式压缩的，DVD 则是用MPEG-2格式压缩的。(7) RM格式格式视频流媒体技术始创者。图像质量较差。特别适合带宽较小的网络用户使用。计算机科学与工程系计

44、算机科学与工程系07 - 49/577.5 动画与视频信息动画与视频信息扫描样张光电转换器数字信号输出(8) RMVB格式格式流媒体RM影片格式上的升级。RMVB在保证了影片整体的视听觉效果的前提下文件大小比DivX影片减少了将近45%。(9) ASF格式格式微软开发的流格式视频文件。是可以直接在网上观看视频节目的文件压缩格式。它的图像质量比VCD差一点，但比同是视频“流”格式的 RM 格式要好。特别适合在网页中插播。 (10) WMV 微软开发的一种可在网上实时播放流格式视频文件。效果好于ASF和RM格式的视频文件。计算机科学与工程系计算机科学与工程系07 - 50/577.6.1 7.

45、6.1 多媒体数据压缩概述多媒体数据压缩概述7.6 多媒体数据压缩多媒体数据压缩l图像（图像（30万像素，真彩色）万像素，真彩色） (64048024)81024=900KBl视频（视频（PAL制式制式,每秒每秒25帧）帧） (90025)1024 22MB /sl声音（采样频率声音（采样频率44.1KHz， 16位量化，双声道）位量化，双声道） (44.11000162) 8 1024=172KB/s 数数据据压压缩缩就就是是将将庞庞大大数数据据中中的的冗冗余余信信息息去去掉掉，保保留留相相互互独立的信息分量。独立的信息分量。(1) 多媒体数据压缩的必要性多媒体数据压缩的必要性计算机科学与工

46、程系计算机科学与工程系07 - 51/577.6 多媒体数据压缩多媒体数据压缩空间冗余空间冗余图像中的某个区域相邻像素的颜色信息相同，则该相邻像素在数字化图像中就表现为空间冗余。时间冗余时间冗余在一个图像序列的两幅相邻图像中，后一幅图像与前一幅图像之间有着较大的相关。F2F2F2F2F1F1F1F1AA(2) 多媒体数据压缩的可能性多媒体数据压缩的可能性多媒体数据可以被压缩，是因为其中存在着冗余信息。多媒体数据可以被压缩，是因为其中存在着冗余信息。计算机科学与工程系计算机科学与工程系07 - 52/577.6 多媒体数据压缩多媒体数据压缩结构冗余结构冗余有些图像的纹理区，图像的像素值存在着明

47、显的分布模式。于是，已知分布模式，可以通过某一过程生成图像。知识冗余知识冗余有些图像的理解与某些基础知识有相当大的相关性。例如，人脸的图像有固定的结构。视觉冗余视觉冗余是指人的视觉分辩率要低于实际图像而产生的冗余。例如，人的视觉对灰度的分辩率为26，而一般图像量化采用的灰度等级为28。计算机科学与工程系计算机科学与工程系07 - 53/577.6 多媒体数据压缩多媒体数据压缩多媒体数据压缩的主要方法可分为统计编码、预测编码、变换编码等。(1) 统计编码统计编码统计编码的理论基础是信息论。数据压缩的理论极限是信息熵。在信息论中，信息熵是对信息量的度量。一个事件的信息量多少，与该事件发生

48、的概率有关。一个小概率事件发生，信息量就多。反之，一个大概率事件的出现，信息量就少。根据香农信息论，只要信源(即要压缩的对象)不是等概率分布，就存在着数据压缩的可能性。统计编码的典型代表是霍夫曼编码和算术编码。7.6.2 多媒体数据压缩的主要方法多媒体数据压缩的主要方法计算机科学与工程系计算机科学与工程系07 - 54/577.6 多媒体数据压缩多媒体数据压缩(2) 预测编码预测编码建立一个模型，这个模型利用以往的样本数据，对下一个新的样本值进行预测，将预测所得的值与实际值相减得到一个差值，再对该差值进行编码。由于差值很小，可以减少编码的码位。预测编码方法分为线性预测和非线性预测编码。(3

49、) 变换编码变换编码一种函数变换。不直接对空域图像信号编码，而是先将空域图像信号映射变换到另一个正交矢量空间(变换域或频域)，产生一批变换系数，后再对这些变换系数进行编码处理。正交变换正交变换计算机科学与工程系计算机科学与工程系07 - 55/57(1) JPEG标准标准适合静态的彩色和灰度图像。一般对单色和彩色图像的压缩比通常分别为10:1和15:1。以JPEG方式压缩的文件扩展名为.JPG。一副原始图像一副原始图像经经JPEG压缩压缩10倍后的恢复图像倍后的恢复图像7.6.3 7.6.3 多媒体的主要压缩标准多媒体的主要压缩标准多媒体的主要压缩标准多媒体的主要压缩标准JPEG2000

50、，JPEG的升级版，其压缩率比JPEG高约30左右。 7.6 多媒体数据压缩多媒体数据压缩计算机科学与工程系计算机科学与工程系07 - 56/57(2) MPEG标准标准针对运动图像而设计压缩标准。目前已推出MPEG-1、MPEG-2、MPEG-4，MPEG-7等。 MPEG-1，一个通用标准。VCD采用MPEG-I压缩标准。 MPEG-2，全称为“运动图像及其伴音的编码”，该编码适合高清晰度电视(HDTV)所需要的视频及伴音信号。DVD采用MPEG-2标准。7.6 多媒体数据压缩多媒体数据压缩计算机科学与工程系计算机科学与工程系07 - 57/57 MPEG-4，利用很窄的带宽压缩和传输数据，以求用最少数据获得最佳图像质量。它的目的是用来做互联网视像传送、交互式视频游戏，实时可视通信。如电视电话，视频邮件和视频会议等。 MPEG-7，属于信息方面的检索和搜寻，本质上是常在网上使用的搜索引擎，只不过它提供的是多媒体的信息查询服务。 (3) H.261视听通信编码视听通信编码 H.261是ITU为可视电话和电视会议制定的压缩标准。与MPEG不同的是它的目标是为了适应各种信道容量的数据传输，其主要缺点是图像质量较低。7.6 多媒体数据压缩多媒体数据压缩

展开阅读全文

第7章多媒体技术

最新文档