{广告传媒}多媒体信息的表示

资源描述

《{广告传媒}多媒体信息的表示》由会员分享，可在线阅读，更多相关《{广告传媒}多媒体信息的表示（92页珍藏版）》请在金锄头文库上搜索。

1、第二章多媒体信息的表示,【学习目标】 1.掌握：位图、矢量图的定义。 2.理解：音频信号的数字化处理，矢量图与位图、图像与图形的比较。 3.了解：超文本与超媒体。【学习要点】多媒体信息（文字、音频、视觉媒体、动画）在计算机中是如何表示的。,2.1文字,文字是人与计算机之间进行信息交换的主要媒体。,文本文件,在现实世界中，文字是人们进行通讯的主要形式，文字包括西文和汉字。,2.1.1西文,在计算机中西文采用码表示。是由美国国家标准局()制定的码（）例如：字符A的码值为065；字符B的码值为066；字符C的码值为067；,2.1.2汉字,1.汉字的输入编码（1）数字编码数字

2、编码输入的优点是无重码，缺点难以记忆。（2）拼音码以汉语拼音为基础的输入法，汉字输入法重码率很高，同音字的选择影响了输入速度的提高。（3）字型编码五笔,2.汉字内码,汉字内码用于汉字信息的存储、交换、检索等操作的机内代码，一般采用两个字节表示。,3.汉字字模码,字模码是用点阵表示的汉字字形代码，它是汉字的输出形式,2.2 音频,音频分类 1.波形声音包含了所有的声音形式，它可以把任何声音都进行采样量化，并恰当地恢复出来。,2.2音频,音频分类 2.语音人的说话声虽是一种特殊的媒体，但也是一种波形，所以和波形声音的文件格式相同。,3.音乐符号化了的声音，乐谱可转变为符号媒

3、体形式。,2.2.1 数字音频,音频数字声音波形质量的主要技术参数采样频率等于波形被等分的份数，份数越多，质量越好 11.025、 22.05、44.1 采样精度每次采样信息量 8位、16位通道数声音产生的波形数单声道、立体声道、5.1声道,数据量计算： (采样频率采样精度通道数时间 )/8 字节,2.1.1 常见的媒体元素,动画动画的概念运动的图画，实质是一幅幅静态图像的连续播放。动画的连续播放既指时间上的连续，也指图像内容上的连续，即播放的相邻两幅图像之间内容相差不大。计算机设计动画方法造型动画帧动画,2.1.1 常见的媒体元素,动画帧动画,2.1.1

4、常见的媒体元素,动画帧动画,2.1.2 媒体的种类,视觉,2.1.2 媒体与多媒体,听觉触觉其他感觉,其它（嗅觉、味觉等）,2.1.3 媒体的性质和特点,各种媒体具有不同特点和性质媒体是有格式的不同媒体表达信息的特点和程度各不相同媒体之间可以相互转换媒体之间的关系也具有丰富的信息媒体具有空间性质表现空间媒体按相互的空间关系进行组织视觉空间、听觉空间和触觉空间这3者既相互独立又需要相互结合,2.1.3 媒体的性质和特点,媒体的时间性质表现需要时间媒体在时间坐标轴上的相互关系媒体的语义媒体的语义是有层次的抽象的程度不同，语义的重点也就不同媒体结合的影响媒体结合是

5、多层次的媒体结合有利于信息接受和理解隐喻交互的概念模型，也称心智模型,2.2 听觉媒体技术,2.2.1 声音心理学,1.声音的量纲声音的振动是一种正弦波，声音的变化必须确定三件事：频率（变化的速度）、幅度（产生的压力）、相位（何时开始）。另外一方面，人们可以感觉到声音的强弱，可以感觉到歌唱家音调的高低。因此，声音的量纲分为声音的物理量纲和心理量纲。,2.2.1 声音心理学,物理量纲可以用精确的值来描述，但对某一具体声音得来的心理印象却不容易说明白，因为心理印象要由被测者的经验而定。声音的心理属性和物理属性不可等同，首先，这些关系不是线性的；其次这些关系不是孤立的；第三这些关系不是

6、不变的。,2.2.1 声音心理学,两者之间确有关系：例如声音的响度取决于强度和频率两个因素，如果频率不变，强声显得比弱声要响些。但如果强度不变，过高频率的声音和过低频率的声音似乎比中频的声音听起来都要弱一些。由此可见，响度依赖于频率，原因是人耳能反应的频率范围是有上限和下限的。,2.2.1 声音的量纲,2.2.1 声音心理学,2.听觉特性等响曲线由于响度与频率和强度有关，所以在不同频率上的强度是不同的。先设一个音为标准音，给予固定的频率、强度和持续时间，例如1000、40分贝、持续0.5秒；再给一个音也持续0.5秒，但频率不同，通过调整使其响度听起来一样，得到的这样一组曲线称之为等响曲线。

7、等响曲线描述的是响度与频率和强度的关系。从声音心理学考虑，对同一响度的声音在频率上和强度上可以有很大的差别，这对声音表现有重要意义。,2.2.1 声音心理学,掩蔽（）声音的响度不仅取决于自身的强度和频率，而且也依赖于同时出现的其它声音。各种声音可以互相掩蔽，也就是说一种声音的出现可能使得另一种声音难于听清。由于声音的掩蔽效果，可以欺骗人的听觉。例如，本来是多种频率的声音的复合，但听众以为是另一种声音。所以，声音的掩蔽特性常常用于声音的压缩。,2.2.1 声音心理学,临界频带在频率的某一临界区里，各种声音是相互作用的，合成声音的响度由这些频率共同决定。如果超出临界区，声音的响度不再相互作用，

8、声音的响度随频率的改变而改变。这个临界区就是临界频带，其宽度视其中心频率而定。对于临界频带的确定，使得对声音响度的处理能够有的放矢。,2.2.1 声音心理学,相位从声音的波形来看，声音的起点和方向也要反映声音的特性，这就是声音的相位。当两个声音相同相位完全相反时，它们将相互抵消；当两个声音相同而且相位也相同时，声音就会得到加强。相位的确定对于多声道声音系统的设计非常重要，其可以应用在回声的消除、会议系统的声音设计上。,2.2.1 声音心理学,自然声音的时变现象声音的音调分成三个区域：起始区、稳定状态区、延迟区。研究表明，音调的频谱分量随时间改变。在稳定状态区，频谱保持固定。在起始区，振

9、幅频谱随时间变化。因此自然声音的起始部分是非常难识别的。例如刚听了一小节音调后要识别乐器，专家也会觉得较难。时变现象用于数字系统中，说明声音中的某些错误是不太容易发现的，但如果出现停顿就很容易引起人的注意。,2.2.1 声音心理学,听觉空间人耳可听到来自各个方向的声音，并用不同的因素来判定声源的位置。声源的位置不论对于增进人们的感受还是增进对声音的理解，都是非常重要的。通过声音的精确再现，就可以构造出听觉空间。方位的线索是各种声音到达两耳的精确时间和强度。,2.2.1 声音心理学,听觉的频谱特性声音是时间函数，通过傅里叶变换可做出其频谱图。人耳对频谱成分的波峰和波谷是非常敏感的。在语言中

10、，元音很少有频谱变速变化的区域。基频改变，人耳是很敏感的。例如：快进的录像，音调会发生变化。音色非常复杂，目前尚在研究中。音色的处理将使我们能识别音源，音色也代表和声音有关的主观质量。,2.2.1 声音心理学,声音的心理模拟通过人工真实的方法，可以对视觉空间的景物进行再造或虚构，同样也可以对听觉空间的声音进行心理的模拟，这就是所谓的可听化（）。用声音可以表达出一些声音的效果。,2.2.2 音频的数字化和符号化,从人与计算机交互的角度看，音频信号的处理包括下述3点：人与计算机通信，也就是计算机接收音频信号。包括音频获取、语音的识别和理解。计算机与人通信，也就是计算机输出音频。包括音乐合成

11、、语音合成、声音的定位以及音频视频的同步。人-计算机-人通信。人通过网络与异地的人进行语音通信，相关的音频处理有语音采集、音频的编码和解码、音频的存储、音频的传输、基于内容的检索等。,2.2.2 音频的数字化和符号化,1音频的数字化与再现在计算机中，所有的信息都以数字来表示。声音信号也是由一系列的数字来表示的，称为数字音频。数字音频的特点就是保真度好，动态范围大。数字声音是一个数据序列。它是由外界声音经过采样、量化和编码后得到的。,2.2.2 音频的数字化和符号化,对声音进行采样用奈奎斯特采样定理来决定采样的频率。根据该定理，只要采样频率高于信号中最高频率的两倍，就可以从采样中完全恢复原

12、始信号的波形。因为人耳所能听到的频率范围为20到20，所以实际的采样过程中，为了达到好的效果，就采用44.1作为高质量声音的采样频率。如果达不到这么高的频率，声音恢复的效果就会差一些，例如电话声音的质量等。一般来说，声音恢复和采样频率、信道带宽都有关。,声音的采样以及量化图,2.2.2 音频的数字化和符号化,2.2.2 音频的数字化和符号化,与数字音频相关的重要特性：采样频率采样频率与声音的质量关系最为紧密。采样频率越高，声音质量越接近原始声音，所需的存储量便越多。标准的采样频率有三个：44.1，22.05，和11.025。采样位数存放一个采样点所需的比特数。一般的采样位数为8位或16

13、位，即把声音采集为256等份或65536等分。,2.2.2 音频的数字化和符号化,声道数有单声道、双声道和多声道。如多种语言音频混存时，需要多声道数据量,2.2.2 音频的数字化和符号化,2声音的符号化波形声音可以把音乐、语音都进行数据化并且表示出来，但是并没有把它看成音乐和语音。对于声音的符号化（也可以称为抽象化）表示包括两种类型：一种是音乐，一种是语音。,2.2.2 音频的数字化和符号化,（1）音乐的符号化 ( )是指乐器数字接口的国际标准。消息，是指乐谱的数字描述。任何电子乐器，只要有处理消息的微处理器和合适的硬件接口，就构成了一个设备。当一组消息通过音乐合成芯片处理时，合成

14、器能解释这些符号并且产生音乐。的关键是作为媒体能够记录这些音乐的符号，相应的设备能够产生和解释这些符号。它给出了一种得到音乐声音的方法。,2.2.2 音频的数字化和符号化,的特点：与波形声音相比，不是声音数据而是指令，所以数据量要少得多。30分钟的音乐，用文件记录只需200，用16位品质的未压缩文件记录需317 可以与其他波形声音配合使用，形成伴乐的效果。而两个波形声音一般是不能同时使用的对的编辑也很灵活，用户可以自由地改变音调、音色等属性，直到自己想要的效果在音质上还不能与真正的乐器完全相似。无法模拟自然界中其它非乐曲类声音,2.2.2 音频的数字化和符号化,（2）语音的符号化语

15、音与文字是对应的。波形声音可以记录表示语音，它是不是语音取决于听者对声音的理解。对语音的符号化实际上就是对语音的识别，将语音转变为字符，反之也可以将文字合成语音。语音指构成人类语音信号的各种声音。在采集和存储上可以与波形声音一样，但由于语音是由一连串的音素组成。“一句话”中包含许多音节以及上下文过渡过程的连接体等特殊的信息，并且语音本身与语言有关，所以要把它作为一个独立的媒体来看待。,2.2.3 音频媒体的三维化处理,1三维虚拟声空间所谓三维虚拟声空间（，3），是指用一定的声音设备人为地产生出来的具有空间位置信息的声音空间。三维听觉的使用明显地依赖于用户对听觉空间中各种信息源的定位能力

16、。一般说来，三维虚拟声空间要达到以下的一些目标：在可听的范围内重现频率分辨度和动态范围；在三维空间中精确地呈现声音的位置信息；能表达多个静止和移动的声源；能和头部的动作具有一定的关联；能够支持一定程度的交互。,2.2.3 音频媒体的三维化处理,23的基本理论人类感知声源位置的最基本的理论是双工理论，该理论基于两种因素：两耳间声音的到达时间差（）和两耳间声音的强度差（）。时间差是由于距离的原因造成的，当声音从正面传来时，距离相等，所以没有时间差；但若偏右3o，则到达右耳的时间就要比左耳约早30，而正是这30，使得我们辨别出了声源的位置。强度差是由于信号衰减造成的，信号的衰减是因为距离产生的，在很多情况下是因为人的头部遮挡，使声音衰减，产生了强度的差别，使得靠近声源一侧的耳朵听到的声音强度要大于另一耳。,2.2.3 音频媒体的三维化处理,3理论较形象地说明：人耳对声音定位

展开阅读全文

{广告传媒}多媒体信息的表示

最新文档