串讲7多媒体基础知识、分布式数据库.doc

上传人:公**** 文档编号:556336256 上传时间:2023-06-15 格式:DOC 页数:9 大小:116.51KB
返回 下载 相关 举报
串讲7多媒体基础知识、分布式数据库.doc_第1页
第1页 / 共9页
串讲7多媒体基础知识、分布式数据库.doc_第2页
第2页 / 共9页
串讲7多媒体基础知识、分布式数据库.doc_第3页
第3页 / 共9页
串讲7多媒体基础知识、分布式数据库.doc_第4页
第4页 / 共9页
串讲7多媒体基础知识、分布式数据库.doc_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《串讲7多媒体基础知识、分布式数据库.doc》由会员分享,可在线阅读,更多相关《串讲7多媒体基础知识、分布式数据库.doc(9页珍藏版)》请在金锄头文库上搜索。

1、串讲七 多媒体基础知识、网络与数据库(一)、多媒体基础知识多媒体技术知识点主要在上午试题中出现。这一章内容相对来说比较简单,关键在于概念和原理的理解,请大家注意。一、图形和图像(1)基本原理: 亮度、色调和饱和度亮度:表示光的明亮程度,它与被观察物体的发光强度和人类视觉系统的视敏功能有关。色调:反映的是颜色的种类,是决定颜色的基本特性。饱和度:指颜色的纯度,即掺入白光的程度,或者说是颜色的深浅程度。色调和饱和度通称为色度。 彩色空间在多媒体技术中,用得最多的是RGB彩色空间表示。而一般在彩色电视系统中,采用的是YUV彩色空间。另外,还有CIE XYZ、CIE LAB、CCIR601-2YCbC

2、r彩色空间等。 图形图像文件图形是指用计算机绘制工具绘制的画面,包括直线、曲线,圆/圆弧,方框等成分。图形一般按各个成分的参数形式存储,可以对各个成分进行移动、缩放、旋转和扭曲等变换,可以在绘图仪上将各个成分输出。图像是由输入设备捕捉的实际场景或以数字化形式存储的任意画面。图像可以用位图或矢量图形式存储。 位图也叫黑白图象,它是按图像点阵形式存储各像素的颜色编码或灰度级。位图适于表现含有大量细节的画面,并可直接、快速地显示或印出。其存储量大,一般需要压缩存储。 矢量图它用一组指令或参数来描述其中的各个成分,易于对各个成分进行移动、缩放、旋转和扭曲等变换。矢量图适于描述由多种比较规则的图形元素构

3、成的图形,但输出图像画面时将转换成位图形式。(2)图形图像的主要指标图形图像的主要指标有分辨率、色彩数、图形灰度。分辨率有屏幕分辨率和输出分辨率。前者用每英寸行数和列数表示,后者是以每英寸的像点数表示。图形图像的色彩数和灰度级则是用位来表示。其中真彩是24位。 (3)图形和图像文件格式: BMP:PC机上最常见的位图格式,尤其在Windows系统中使用特别广泛。 GIF:主要用于在不同平台上进行图像交换,是经过压缩的图形格式。GIF文件最大64MB,颜色数最多256色。 JPEG:文件压缩比较高,文件比较小。虽然它采用的是有损压缩算法,但对图形图像的损失影响并非很大。其色彩数最高可达到24位。

4、 TIF:有压缩和非压缩两大类,是许多图像应用软件所支持的主要文件格式之一,其最高支持的色彩数可达16M。 PSD:Photoshop中的标准文件格式,专门为Photoshop而优化。 CDR:CorelDraw的文件格式。二、音频(1)基本概念模拟录音方式直接记录音频信号的波形,重放时用磁头拾取信号。数字声音是一个数据序列,是一种采样的声音,它是由模拟声音经采样、量化和编码后得到的。采样:将时间连续的模拟信号转换成时间离散、幅度连续的信号。采样频率不应低于声音信号最高频率的两倍。语音信号的采样频率为8kHz,音乐信号的采样频率应在40kHz以上。量化:把在幅度上连续取值的每一个样本转换为离散

5、值表示,也成为A/D转换(模数转换)。量化后的样本是采用二进制数来表示,二进制数数位数的多少反映了量度声音波形幅度的精度,称为量化精度,也称为为量化分辨率。编码:选择某一种或者几种方法对它进行数据压缩,以减少数据量,再按照某种规定的格式将数据组织成为文件,便于计算机存储、处理和传输。在对音频数据进行压缩时,需要从语音质量、数据率和计算量3个方面来加以考虑。语音压缩编码从压缩方法来看,可分为3类。 波形编码:有脉冲编码调制(PCM)、自适应差分脉冲编码(ADPCM)和子带编码(SBC)。采用这种编码可获得高质量语音,而且通用性强,但压缩比低。 参数编码:有线性预测编码(LPC)和声码器。该方法的

6、压缩比低,但质量又不高。 混合编码:综合前面两种方法的编码方法。既能达到高的压缩比,又能保证一定的质量。(2)波形声音未经压缩的数字音频的数据传输率如下计算:数据传输率(b/s)采样频率(Hz)量化位数(b)声道数波形声音经过数字化后所占用的存储空间如下计算: 声音信号数据量数据传输率持续时间/8(B) 大家请将326页例6.1看一下,我会讲解这道题。(3)语音、语言和音乐合成语音合成从合成采用的技术来讲可分为: 发音参数合成 声道模型参数合成 波形编辑合成如果从合成策略上又可分为: 频谱逼近 波形逼近实现计算机语音输出有两种方法:一.录音/重放;二.文-语转换;语言合成目前和仅处于文字到语音

7、转换的层次上。文-语转换(TTS)是一种智能型的语音合成,需要建立语音参数数据库、发音规则库等。 音乐合成技术有两种:调频(FM)合成和波形表(Wave Table)合成(4)常见音频格式:名称扩展名特点缺点WAVEWAV完整记录声音的波形,不使用压缩文件太大MODMOD、ST3、XT、S3M、FAR和669等文件中不仅存放了乐谱,还存放了乐曲使用的各种音色样本。回放效果明确,音色种类永无止境。低音效果差MPEG-3MP3目前最流行的格式,压缩较大。有损压缩,音质不完美Real AudioRA压缩比高,失真度小有损压缩,音质并不好Create Musical FormatCMFCreative

8、公司专用音乐格式。兼容性差CD AudioCDA唱片采用格式,记录的是波形流无法编辑、文件太大MIDIMID音乐工业的数据标准不能记录语音三、图像:(对 一 的深入讲解)(1)基本概念 分辨率:(1)显示分辨率指显示屏上能够显示出的象素数目。数目越多图像质量越好。(2)图像(显示)分辨率指组成一副图像的象素密度,用每英寸多少点(dpi)来表示图像的大小。分辨率越高图像越清晰。显示分辨率和图像分辨率的关系:(1)图像(显示)分辨率显示分辨率时,屏幕上只能显示部分图像(2)图像(显示)分辨率显示分辨率时,图像只占屏幕一部分。 图像深度:指存储每个象素所用的位数,也用于量度图像的色彩分辨率。如一副图

9、像的图像深度为b位,则该图像的最多颜色数或灰度级为2b种。 真彩色:真彩色指组成一副彩色图像的每个象素值中,有R、G、B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色成为真彩色。 伪彩色:为了减少彩色图形的存储空间,在生成图像时,可对图像中的不同色彩进行采样,产生彩色查找表图像中每个象素的颜色是把象素值作为地址索引,以便在彩色查找表中查找这个象素的实际R、G、B分量。(2)图像的压缩编码:图像数据量估算:图像数据量图像的总象素图像深度/8(B)其中图像的总象素是图像的水平象素乘以垂直象素。例如,640480的256色图像,大小为:6404808/8300KB数据压缩分为两

10、类:一类是无损压缩,另一类是有损压缩。 无损压缩利用数据的统计冗余进行压缩,可以保证在数据的压缩和还原过程中图像信息没有损耗或失真。图像还原时可完全恢复。例如: 行程长度编码:某些图像往往有许多颜色相同的块,这时就不需要存储每一个象素的颜色值,而仅仅存储每一个象素值以及具有相同颜色的象素数目。具有同一颜色的连续象素的数目成为行程长度。 增量调制编码:在比较大的范围内,自然图像往往有颜色虽不完全一致,但变化不大的特点。除了轮廓特别明显的地方以外,大部分区域都具有这种特点。增量调制编码就是利用图像相邻象素值的相关性来压缩每个象素值的位数,以达到减少存储容量的目的。 霍夫曼编码:大多数图常常包含单色

11、的大面积图块,而且某些颜色比其它颜色出现的更频繁。霍夫曼编码先对图像数据扫描一遍,计算出各种象素出现的概率,按概率的大小指定不同长度的唯一编码码字,由此得到一张图像的霍夫曼表。编码后的图像数据记录的是每个象素的码字。四、视频:(1)数字视频标准: 采样频率:电视图像采样标准为13.5MHz 分辨率:对于PAL和SECAM制式的亮度信号,每一扫描行采集864个样本点。对于NTSC制式的亮度信号,每一扫描行采集858个样本点。每一扫描行的有效样本点数均为720个。 数据量:规定每个样本都按8位数字化,即有256个等级。但实际上亮度信号占220级,色度信号占225级,其他位作同步和编码等控制使用。(

12、2)视频压缩编码基本概念: 无损压缩与有损压缩:类似于静态图像的相关概念。 帧内和帧间压缩:帧内压缩称为空间压缩,当压缩一帧视频时,仅考虑本帧的数据而不考虑相邻帧之间的冗余信息。帧间压缩也称为时间压缩,它通过比较时间轴上不同帧之间的数据进行压缩,即利用两帧之间信息变化很小的特点进行压缩。 对称和不对称编码:对称编码意味着压缩和解压缩占用相同的计算处理能力和时间。对称算法适合实时压缩和传送视频。而不对称编码意味着压缩时需要花费大量的处理能力和时间,而解压缩时则能较好的实时回放,即以不同的速度进行压缩和解压缩。一般来说,压缩比解压缩时间要多得多。例题1:MPEG-I编码器输出视频的数据率大约为_C

13、_。PAL制式下其图像亮度信号的分辨率为_A_,帧速为_B_。 (多媒体)(44)A128Kb/sB320Kb/sC1.5Mb/sD15Mb/s(45)A352288B576352C720576D1024720(46)A16帧/秒B25帧/秒C30帧/秒D50帧/秒例题2:在多媒体的音频处理中,由于人所敏感的声频最高为A赫兹(Hz),因此数字音频文件对音频的采样频率为B赫兹(Hz)。对一个双声道的立体声,保持1秒钟声音,其波形文件所需的字节数为C,这里假设每个采样点的量化位数为8位。MIDI文件是最常用的数字音频文件之一,MIDI是一种D,它是该领域国际上的一个E。 A: 50 10k 22k

14、 44kB: 44.1k 20.05k 10k 88k C: 22050 88200 176400 44100 D: 语音数字接口 乐器数字接口 语音模拟接口 乐器模拟接口 E: 控制方式管理规范 通信标准 输入格式在音频处理中,采样频率是决定音频质量的一个重要因素,它决定了频率响应范围。对声音进行采样的三种标准以及采样频率分别为:语音效果(11kHz)、音乐效果(22kHz)、高保真效果(44.1kHz),目前声卡的最高采样率为44.1KHz。另外,一般人的听觉带宽为20Hz20kHz,人敏感的声频最高为22kHz。信号编码的位数是决定音频质量的另一个重要因素,它决定数字采样的可用动态范围和信噪比。16位声卡的采样位数就是16。声音文件的存储量等于采样频率采样位数声道数。如本题所求波形文件的字节数计算公式如下:44.1kHz8bit21秒=705.6Mbit/8=88.2

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号