《基础班多媒体技术课件》由会员分享,可在线阅读,更多相关《基础班多媒体技术课件(100页珍藏版)》请在金锄头文库上搜索。
1、数字媒体及应用数字媒体及应用1 文本 2 图像和图形3 数字声音4 数字视频基础班多媒体技术学习目标与要求1. 熟练掌握GB2312,GBK和GB18030三种汉字编码标准的内容、关系与应用,熟悉中文文本准备的方法,掌握常用文本类型与处理方式2.掌握数字图像获取的原理与方法,熟悉图像在计算机中的表示,熟悉数字图像常见压缩标准的特点与应用3. 掌握声音获取的方法与设备,熟悉波形声音在计算机中的表示与压缩编码,初步了解语音合成和音乐合成的过程与应用4. 了解数字视频的获取方法与设备,熟悉视频压缩编码的几种标准及其应用基础班多媒体技术多种信息在计算机内的表示多种信息在计算机内的表示数值西文汉字声音、
2、图像十/二进制转换ASCII码输入码/机内码模/数数值西文汉字声音、图像二/十进制转换西文字型码汉字字型码数/模计算机计算机输入设备输入设备输出设备输出设备基础班多媒体技术1 文本文本基础班多媒体技术n字符集字符集o常用字符的集合。n西文字符集西文字符集o由拉丁字母、数字、标点符号及一些特殊符号组成。n字符的编码字符的编码o字符集中每一个字符各有一个代码,即字符的二进制表示,称为该字符的编码。文本在计算机中的处理文本在计算机中的处理基础班多媒体技术西文字符编码(常考)西文字符编码(常考)o在计算机中,所有西文信息必须用二进制在计算机中,所有西文信息必须用二进制表示表示o目前广泛使用的西文字符集
3、及其编码目前广泛使用的西文字符集及其编码 ASC码码n美国标准信息交换码美国标准信息交换码(American Standard (American Standard Code for Information Interchange)Code for Information Interchange)n使用使用7 7个二进位对字符进行编码个二进位对字符进行编码(标准(标准ASCIIASCII码),称为码),称为ISO-646ISO-646标准。标准。基础班多媒体技术o基本的ASCII字符集共有128(27)个字符n96个可打印字符(常用字母、数字、标点符号等)32126n32个控制字符031及12
4、7西文字符编码西文字符编码基础班多媒体技术西文字符编码西文字符编码o例:“A” 的ASCII码为41H(65D)“D” 的ASCII码为? “a” 的ASCII码为61H(97D) “g” 的ASCII码为? “0” 的ASCII码为30H(48D) “空格”的ASCII码为32o注意:数字、字母的ASCII码是连续的,对应大、小写字母的ASCII码相差32。基础班多媒体技术delo_O?/_O1111nN.N1110mM=-M1101| IL,L1100KK;+K1011ZjZJ:*ZJ1010yiYI9)YI1001xhXH8(XH1000wgWG7 WG0111vfVF6& VF0110
5、ueUE5% UE0101tdTD4$ TD0100scSC3# SC0011rbRB2 RB0010qaQA1!QA0001pP0SPP0000111110101100011010001000b3b2b1b0 b6b5b4 ASC码表基础班多媒体技术o标准ASCII字符集只有128个不同的字符,在很多应用中无法满足要求。o每个扩充ASCII字符集分别可以扩充128个字符,这些扩充字符的编码均是高位为1的8位代码(十进制数128255),称为扩展扩展ASCIIASCII码码。o扩充ASCII字符集=标准ASCII字符集+扩展ASCII字符集扩充扩充ASCII字符集字符集基础班多媒体技术一、GB
6、2312-80汉字编码信息交换用汉字编码字符集基本集(GB2312-80) 1 1、组成、组成o第一部分第一部分n字母、数字和各种符号,包括拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个(统称为GB2312图形符号)汉字编码(重点掌握)汉字编码(重点掌握)基础班多媒体技术汉字编码汉字编码o第二部分第二部分n一级常用汉字,共3755个,按汉语拼音排列。o第三部分第三部分n二级常用字,共3008个,按偏旁部首排列。基础班多媒体技术2 2、区位码、区位码oGB2312国标字符集构成一个二维平面,它分成94行、94列,行号称为区号,列号称为位号。o每一个汉字或符号在码表中都有各自的
7、位置,字符的位置用它所在的区号(行号)及位号(列号)来表示。每个汉字的区号和位号分别用1个字节来表示。汉字编码汉字编码基础班多媒体技术基础班多媒体技术o如:“大”字的区号20,位号83,o区位码是20 83,o用2个字节表示为:00010100 01010011基础班多媒体技术3 3、国标码、国标码n为了避免汉字区位码与通信控制码的冲突,ISO2022规定,每个汉字的区号和位号必须分别加上32(即二进制0010 0000),亦即+2020H。n经过这样处理得到的代码称为汉字的“国标交换码”(简称交换码)。n如:如:“大”字的交换码是: 00110100 01110011汉字编码汉字编码基础班多
8、媒体技术4.4.机内码机内码n为区分文本中的汉字与西文字符n把一个汉字看作两个扩展ASCII码,使表示GB2312汉字的两个字节的最高位(b7)都等于“1”。这种高位为l的双字节(16位)汉字编码就称为GB2312汉字的“机内码”,又称内码。n国标码每字节+128,即+8080H,2个二进制10000000n如:如:“大”字的内码是:10110100 1(B4F3)汉字编码汉字编码基础班多媒体技术o国标码=区位码+2020Hn20H=00100000,第6位+1o机内码=国标码+8080Hn80H=10000000,第8位+1o机内码=区位码+A0A0HnA0H=10100000,第6和第8位
9、分别+1区位码、国标码和机内码的关系区位码、国标码和机内码的关系基础班多媒体技术o说明n汉字机内码为双字节,最高位为1n西文字符机内码为单字节,最高位为0基础班多媒体技术o问题:问题:GB2312-80只有6763个汉字,使用时功能不够。o解决方法:解决方法:1995年发布GBK,全称为汉字内码扩展规范。oGBKGBK字符集中一共有21003个汉字和883个图形符号,它与GB2312国标汉字字符集及其内码保持兼容,繁简体同平面共存。nGBK/1:GB2312中的符号nGBK/2:GB2312中的全部汉字nGBK/4和GBK/3:包括繁体字在内的大量汉字nGBK/5:符号o例如:例如:計算機係等
10、繁体汉字和冃冄円冇鎔等生僻的汉字。GBK汉字内码扩充规范汉字内码扩充规范基础班多媒体技术o应用应用n操操作作系系统统Windows 95以上简体中文版,采用GBK代码,并提供了多种输入法和字体。n应应用用软软件件Office 95以上简体中文版本提供GBK码的检索和排序。n互互联联网网应应用用许多网站的网页使用GBK代码,但目前还不是所有搜索引擎都支持 GBK 汉字文本的搜索。GBK汉字内码扩充规范汉字内码扩充规范基础班多媒体技术o目标与途径目标与途径o实现所有字符在同一字符集中统一编码。oUCS/Unicodeo用4个字节对全世界现代书面文字所使用的所有字符、符号进行编码(记作 UCS-4)
11、。通用编码字符集通用编码字符集UCS/Unicode基础班多媒体技术oUCSUCS:ISO/IEC 10646ISO/IEC 10646nUniversal Multiple-Octet Coded Character Set,通用多8位编码字符集oUnicodeUnicode:统一码或联合码统一码或联合码n由微软、IBM等联合制定,与UCS完全等同的工业标准。o优优点点:编码空间极大,能容纳足够多的各种字符集(13亿字符)。通用编码字符集通用编码字符集UCS/Unicode基础班多媒体技术o缺缺点点:4字节的字符编码使存储空间浪费严重。(UCS-4)o实际方案实际方案n采用双字节的UCS-2
12、编码,共有字符49194个nUTF-8 可变长编码,1、2、3字节通用编码字符集通用编码字符集UCS/Unicode基础班多媒体技术oUCS/Unicode与GB2312-80和GBK编码不兼容。o为了既能与UCS/Unicode编码标准接轨,又能向下兼容GB2312-80和GBK编码标准。o在GB2312-80和GBK的基础上进行了扩充,增加了4字节的编码,码位总数达160多万个。o能完全映射UCS/Unicode的字符集。o所包含的汉字数目增加到27000多个。GB18030-2000编码编码基础班多媒体技术对比oASC码美国标准信息交换码码美国标准信息交换码n基本的基本的ASCII字符集
13、共有字符集共有128个字符个字符oGB2312-80信息交换用汉字编码字符集信息交换用汉字编码字符集基本集基本集n6763个简体汉字,个简体汉字,682个图形符号个图形符号oGBK-95汉字内码扩充规范汉字内码扩充规范n21003个汉字,个汉字,883个图形符号个图形符号oGB18030-2000n27000多个汉字多个汉字基础班多媒体技术oBIG5 BIG5 繁体中文字符集繁体中文字符集oCJKCJK统一编码汉字统一编码汉字n指中、日、韩、新、马及我国台湾、香港、澳门地区使用的汉字,不论其字义和读音有无区别,只要字形相同,该汉字就只有一个代码。其他编码其他编码基础班多媒体技术计算机处理的文字
14、信息称为计算机处理的文字信息称为文本文本。 文本存储文本存储与传输与传输(阅读器)(阅读器)用户用户文本处理文本处理(文本处理软件)(文本处理软件)文本生成文本生成其他其他媒体媒体电子电子文本文本文本编辑文本编辑(编辑器)(编辑器)格式化的格式化的电子文本电子文本文本输入文本输入文本文本展现展现文本文本基础班多媒体技术文本信息的输入文本信息的输入人工输入人工输入自动识别输入自动识别输入印刷体识别印刷体识别手写体识别手写体识别键盘键盘键盘键盘输入输入输入输入语音语音语音语音输入输入输入输入联机手联机手写输入写输入手写输入手写输入手写输入手写输入扫描输入扫描输入扫描输入扫描输入文本准备(文本输入)
15、文本准备(文本输入)基础班多媒体技术 1 1、键盘输入、键盘输入n键盘输入编码键盘输入编码o由于汉字字数很多,无法使每个汉字与西文键盘上的键一一对应,因此必须使用一个或几个键来表示汉字。n输入编码要求输入编码要求o易学习o易记忆o效率高(平均击键次数较少)o重码少o容量大(可输入的汉字字数多)文本输入文本输入基础班多媒体技术o汉字输入编码方法分类1 1)数字编码)数字编码o使用一串数字来表示汉字的编码方法o如:电报码、区位码等o难以记忆,不易推广2 2)字音编码)字音编码o一种基于汉语拼音的编码方法,简单易学,适合于非专业人员o同音字引起的重码多,需增加选择操作文本输入文本输入基础班多媒体技术
16、o汉字输入编码方法分类3 3)字形编码)字形编码o将汉字的字形分解归类而给出的编码方法o重码少、输入速度较快,编码规则不易掌握o如:五笔字形法和表形码等4 4)形音编码)形音编码o吸取了字音编码和字形编码的优点,使编码规则适当简化、重码减少o不易掌握注意:注意:使用不同的输入编码方法向计算机输入的同一个汉字,它们的内码是相同。文本输入文本输入基础班多媒体技术2 2、扫描输入、扫描输入n通过扫描仪将纸上的文字变成计算机可处理的信息,一般用于大量文字的快速录入。文本输入文本输入基础班多媒体技术o扫描输入的核心:光学字符识别软件OCR (Optical Character Recognition)
17、可对扫描仪输入的文字进行判断,将图像形式的字符转换成计算机能理解的信息形式 应用现状:多字体、多字号、中西文混排、文字表格混排文本输入文本输入基础班多媒体技术3 3、手写输入(联机手写汉字识别)、手写输入(联机手写汉字识别)n以平常书写的习惯,把要输入的汉字写在一块叫作书写板的设备上n书写板将笔尖的运动(包括抬笔、落笔、笔段轨迹以及各笔段之间的时间关系等)按时间采样后发送到计算机中,由计算机软件自动进行识别,然后用该汉字(或符号)对应的代码进行保存n方正如意笔n中科院自动化所汉王手写笔手写笔手写笔手写笔文本输入文本输入基础班多媒体技术4 4、语音输入、语音输入n功能:功能: 命命令令控控制制:
18、向计算机发一个简单的声音指令,控制计算机操作 听听写写:由人来说,计算机来写。有些语音软件是与说话人无关的,成为非特定人识别系统n应用现状应用现状: 特定人连续语音识别率已达到 90% 以上n最高目标:最高目标: 非特定人大词汇量的连续语音识别技术文本输入文本输入基础班多媒体技术 文文本本:是计算机表示文字及符号信息的一种数字媒体o根据是否具有编辑排版功能来分根据是否具有编辑排版功能来分n简单文本简单文本n丰富格式文本丰富格式文本o根据文本内容的组织结构分根据文本内容的组织结构分n线性文本n超文本、超媒体超文本、超媒体文本类型文本类型基础班多媒体技术o由一连串用于表达正文内容的编码字符(包括汉
19、字)组成o几乎不包含任何其他格式信息和结构信息(除“回车”、“换行”、“制表”等有限的几个打印/显示控制字符外)简单文本(纯文本简单文本(纯文本.txt)返回基础班多媒体技术o这种文本通常称为纯文本,文件后缀名.txto呈现为一种线性结构,写作与阅读按顺序进行o文件体积小,通用性好o不能插入图片、表格等,不能建立超链接基础班多媒体技术o文本的格式化对纯文本进行加工,也称排版o在简单文本中增加格式控制和结构说明信息丰富格式文本(rich text format)o不同软件制作的丰富格式文本相互并不兼容返回丰富格式文本丰富格式文本(.rtf)基础班多媒体技术oRTF是一种中间格式,它的目的是使各种
20、丰富格式文本相互交换使用o多 媒 体 文 档 ( Multimedia Document)n含有声音和视频信息的文本基础班多媒体技术n超文本(hypertext)的阅读方式o传统的顺序式阅读线性文本o通过链接、跳转、导航、回溯等操作实现跳跃式阅读n超文本采用一种网状结构来组织信息n超超文文本本的的结结构构( (非非线线性性的的网网状状结结构构) ) 超文本超文本基础班多媒体技术超文本的结构超文本的结构如:如:WindowsWindows操作系统中的操作系统中的“帮助帮助”信息信息 a1 a2 b2 c2 f1d1c1 b1 e1 g1h1返回 超文本超文本基础班多媒体技术n超文本节点中的数据从
21、文字扩展为图形、图像、声音、动画、动态视频n把超文本推广到多媒体的形式n超媒体 = 超文本 + 多媒体n如:因特网的WWW信息系统 超媒体超媒体返回基础班多媒体技术1、文本编辑、文本编辑n文本编辑的主要功能文本编辑的主要功能o对字、词、句、段落进行添加、删除、修改等操作o字的处理:设置字体、字号、字的排列方向、间距、颜色、效果等o段落的处理:设置行距、段间距、段缩进、对齐方式等o页面布局的处理:设置页边距、每页行列数、分栏、页眉、页脚等文本处理文本处理基础班多媒体技术 2、文本处理、文本处理n字词的处理字词的处理o字数统计字数统计,字频统计,简简/ /繁体相繁体相互转换互转换,汉字/拼音相互转
22、换o词语排序,词语错误检测词语错误检测,文句语文句语法检查法检查o自动分词,词频统计,词性标注,词义辨识,大陆/台湾术语转换文本处理文本处理基础班多媒体技术 2、文本处理、文本处理n篇章的处理篇章的处理o关键词提取,文摘自动生成文摘自动生成,文本分类o文本检索(关键词检索、全文检索全文检索),文本过滤o文本压缩,文本加密文本加密,文本著作权保护o篇章理解,自动问答,自动写作等文本处理文本处理基础班多媒体技术3、常用文字处理软件、常用文字处理软件n“所见即所得所见即所得”(What You See Is What You Get)o所有的编辑操作效果立即可以在屏幕上看到o在屏幕上看到的效果与打印
23、机的输出结果相同n常用文字处理软件常用文字处理软件oWPS、Microsoft Word、FrontPage、PDF Writer文本处理文本处理基础班多媒体技术 3、常用文字处理软件、常用文字处理软件 1 1)面向办公的文本处理软件)面向办公的文本处理软件o典型软件nMS-OfficenWPS2000文本处理文本处理基础班多媒体技术2 2)面向出版的文本处理软件)面向出版的文本处理软件n排版软件的主要功能o排版软件的输出的一种使用页面描述语言(如PostScript)描述的文件(.ps文件),n典型排版软件o方正集团公司的“飞腾”排版软件o美国Adobe公司的PageMaker和PDF Wr
24、iter文本处理文本处理基础班多媒体技术3、常用文字处理软件、常用文字处理软件 3 3)面向电子出版的文本处理软件)面向电子出版的文本处理软件o美国Adobe公司的Acrobat,使用PDF格式文件 4 4)面向通信的文本处理软件)面向通信的文本处理软件o计算机网络上最普及的应用是用电子邮件进行通信o典型软件:微软公司的Outlook Express文本处理文本处理基础班多媒体技术3、常用文字处理软件、常用文字处理软件 5 5)面向网络信息发布的文本处理软件)面向网络信息发布的文本处理软件o将文本放在因特网上进行发布o制作成网页(HTML文件)放在WEB服务器上Hypertext Markup
25、 LanguageHypertext Markup Language 超文本标记语言超文本标记语言o用户通过浏览器进行浏览或下载o制作HTML文件的软件:微软的FrontPage等文本处理文本处理基础班多媒体技术o输出过程中字形的生成输出过程中字形的生成o先先根根据据字字符符的的字字体体确确定定相相应应的的字型库(字型库(font)o再按照该字符的代码从字型库再按照该字符的代码从字型库中取出该字符的形状描述信息中取出该字符的形状描述信息o然后按形状描述信息生成字形,然后按形状描述信息生成字形,并按照字号大小及有关属性并按照字号大小及有关属性(粗体、斜体、下横线)将字(粗体、斜体、下横线)将字形
26、作必要的变换形作必要的变换o最后将变换得到的字形放置在最后将变换得到的字形放置在页面的指定位置处页面的指定位置处文本输出文本输出基础班多媒体技术输出过程中字形的生成输出过程中字形的生成o2种不同的字库n点阵描述:点阵描述:用一组排成方阵的点(比特)表示一个汉字o“1”表示对应位置处是黑点,“0”表示对应处是空白文本输出文本输出基础班多媒体技术n轮廓描述:轮廓描述:它把汉字笔画的轮廓用一它把汉字笔画的轮廓用一组直线和曲线来勾画,记下每一直线组直线和曲线来勾画,记下每一直线和曲线的数学描述参数和曲线的数学描述参数o特点:精度高、字形大小可任意变化特点:精度高、字形大小可任意变化oWindows 中
27、的中的Truetype就是一种广泛就是一种广泛使用的轮廓字形标准使用的轮廓字形标准 基础班多媒体技术2 图像与图形图像与图形基础班多媒体技术图像与图形图像与图形o数字图像数字图像以数字形式存储在计算机中的图像信息o按其生成方法可以分为按其生成方法可以分为两大类:两大类:1.通过数字化设备获取的图像取样图像取样图像(sampled image)点阵图像点阵图像(dot matrix image)位图图像位图图像(bitmap image)2.计算机合成的图像(synthetic image)矢量图形矢量图形(vector graphics)简称为图形图形简称为简称为图像图像基础班多媒体技术图像的
28、数字化图像的数字化通过数码照相机、数码摄像机、扫描仪等设备获取通过数码照相机、数码摄像机、扫描仪等设备获取一、图像获取步骤一、图像获取步骤 n扫描扫描n分色分色o将每个取样点分成将每个取样点分成 R、G、B 三个基色三个基色n取样取样o测量每个取样点每个分量的亮度值测量每个取样点每个分量的亮度值n量化量化o对每个分量进行对每个分量进行 A / D 转换,再用数字量转换,再用数字量表示表示基础班多媒体技术图像的数字化过程扫 描模拟图像取 样取 样取 样数字图像分 色量 化量 化量 化基础班多媒体技术图像与图形图像与图形o位图图像的原理:基础班多媒体技术图像的表示方法图像的表示方法n每个取样点称为
29、像素像素n 彩色图像用三个矩阵来表示o矩阵的行数称为垂直分辩率垂直分辩率o矩阵的列数称为水平分辩率水平分辩率o矩阵的元素值是像素颜色分量的颜色分量的亮度值亮度值n黑白、灰度、彩色图像黑白、灰度、彩色图像基础班多媒体技术取样图像的属性取样图像的属性一、分辨率一、分辨率 1 1、图像分辨率、图像分辨率( (又称图像的大小又称图像的大小) ) 由高高宽宽表示 由像素密度像素密度dpi表示 (dot per inch,每英寸像素数) 2 2、位平面的数目、位平面的数目:彩色分量的数彩色分量的数目目基础班多媒体技术取样图像的属性取样图像的属性3 3、颜色模型、颜色模型1 1)、)、RGBRGBo计算机彩
30、色显示器计算机彩色显示器的输入需要RGB三个彩色分量,通过三个分量的不同比例,在显示屏幕上合成所需要的任意颜色2 2)、)、YUVYUV(亮度、色度)(亮度、色度) 电视系统电视系统中用YUV模型来表示彩色图像基础班多媒体技术取样图像的属性取样图像的属性4 4、像素深度(位深度、颜色深度)、像素深度(位深度、颜色深度)n指位图中记录每个像素点所占的二指位图中记录每个像素点所占的二进制位数进制位数n常用的图像深度常用的图像深度1、 4、8、16、24等等像素深度决定了可表示的颜色的数像素深度决定了可表示的颜色的数目目n例:如果像素的例:如果像素的R、G、B三个基色三个基色分量各用分量各用8bit
31、来表示,共可记录来表示,共可记录224 =16M种色彩种色彩(真彩色真彩色)基础班多媒体技术取样图像的属性取样图像的属性n16色、256色、真彩色位图之比较:基础班多媒体技术图像的数字化图像的数字化位图文件的大小位图文件的大小 存储整幅图像所占的字节数 计算公式计算公式:文件的字节数 = 图像分辨率像素深度/8 8 例:一幅分辨率为1024768的图像,若显示256色色,即像素深度为8位,则其文件的大小为 (1024768 8)/8=786432B基础班多媒体技术静态图像压缩编码静态图像压缩编码一、图像压缩的类型一、图像压缩的类型n无损压缩无损压缩o压缩以后的数据进行图像还原(也称为解压缩)时
32、,重建的图像与原始图像完全相同基础班多媒体技术n有损压缩有损压缩o使用压缩后的数据进行图像重建时,重建后的图像与原始图像虽有一定的误差,但不影响人们对图像含义的理解基础班多媒体技术静态图像压缩标准静态图像压缩标准JPEG二、图像压缩编码的国际标准二、图像压缩编码的国际标准1 1、JPEGJPEG标准标准o适用于彩色和单色多灰度或连续色彩静止数字图像基础班多媒体技术静态图像压缩标准静态图像压缩标准JPEGJPEGJPEG标准的特点:标准的特点:n适用范围广适用范围广n能能处处理理各各种种连连续续色色调调的的彩彩色色或或灰灰度度图图像像n算法复杂度适中算法复杂度适中n既可用硬件实现,也可用软件实现
33、既可用硬件实现,也可用软件实现n图像的压缩比可控制图像的压缩比可控制(压缩比越低,图像质量越好;压缩(压缩比越低,图像质量越好;压缩比越高,图像质量越差)比越高,图像质量越差)基础班多媒体技术静态图像压缩标准静态图像压缩标准JPEG2 2、JPEG 2000JPEG 2000nJPEG的升级版,它向下兼容JPEG标准n采用了小波分析等先进算法n提供了更好的图像质量,更低的码率n更适合在WWW网上传输基础班多媒体技术常用图像文件格式常用图像文件格式名称名称性质性质典型应用典型应用开发组织开发组织/公司公司BMP无损Windows应用程序MicrosoftPCX无损PC Paintbrush绘画软
34、件ZSOFTTIF无损Desktop publishingAldus,MicrosoftGIF无损InternetCompuServeJPEG无损/有损Internet,数码相机等ISO/IECPSD 无损/有损Photoshop AdobePNG无损/有损FireworksMicromediaJP2无损/有损Internet,数码相机等ISO/IEC基础班多媒体技术图形图像处理软件图形图像处理软件o位图图像 微软公司画图软件(paint) ACD System公司的ACDSee32 Photoshopo矢量图形 CorelDraw Adobe Illustrator Macromedia F
35、reehand基础班多媒体技术3 声音信息处理声音信息处理基础班多媒体技术声音的相关概念声音的相关概念o多媒体技术处理的声音信号多媒体技术处理的声音信号n声音信号是一种模拟信号模拟信号特点:时间和幅度都是连续的n计算机处理的声音是数字信号数字信号,通常称为数字音频特点:时间和幅度两者都是离散的 基础班多媒体技术声音的相关概念声音的相关概念o音频文件的分类:音频文件的分类:(1)声音文件:)声音文件:指通过声音录入设备录制的原始声音,直接记录了真实声音的二进制采样数据,通常文件较大基础班多媒体技术(2)MIDI文件:文件:它是一种音乐演奏指令序列指令序列,相当于乐谱,可以利用声音输出设备或与计算
36、机相连的电子乐器进行演奏,由于不包含声音数据,其文件较小基础班多媒体技术声音信号的数字化声音信号的数字化 1 1、声音信号的数字化实质、声音信号的数字化实质o将模拟声音信号转换成数字编码形式以便于计算机进行处理的过程基础班多媒体技术2、声音信号数字化的过程声音信号数字化的过程 取样取样n取取样样定定理理:取取样样频频率率不不低低于于声声音音信信号号频率的两倍频率的两倍n取样频率:语音取样频率:语音8kHz8kHz,音乐,音乐40kHz40kHzoo量化量化n量化精度越高,声音的保真度越高量化精度越高,声音的保真度越高n量化精度:量化精度:8 8位,位,1212位,位,1616位位oo编码编码n
37、按某种格式将数据进行组织、压缩,按某种格式将数据进行组织、压缩,便于便于计算机存储、处理和在网上传输计算机存储、处理和在网上传输基础班多媒体技术声音信号数字化的过程声音信号数字化的过程基础班多媒体技术音频卡(声卡)音频卡(声卡)波形声音的获取设备波形声音的获取设备n联机获取设备:联机获取设备:麦克风、声卡n脱机获取设备脱机获取设备:录音笔麦克风麦克风microphone声音卡声音卡sound card声波转换为电信号取样、量化、压缩、编码模模拟拟声声音音数数字字声声音音基础班多媒体技术声音信号的数字化声音信号的数字化3 3、波形声音的主要参数、波形声音的主要参数取样频率取样频率量化位数量化位数
38、声道数目声道数目1(单声道)、2(双声道)、5.1/7.1(环绕立体声)使用的压缩编码方案使用的压缩编码方案数码率数码率(bit rate)指的是每秒钟的数据量,也称比特率、码率基础班多媒体技术声音信号的数字化声音信号的数字化 码率的计算公式码率的计算公式 1 1)数字声音未压缩前)数字声音未压缩前波形声音的码率波形声音的码率 ( (比特比特) ) 取样频率取样频率 量化位数量化位数 声道数声道数例:例:用44.1kHz的取样频率对声波进行取样,每个取样点的量化位数为16位,声道数目为2(立体声),其波形声音的码率为 44.11000l62/8=176400(字节) 2 2)压缩编码后)压缩编
39、码后 码率压缩前的码率码率压缩前的码率/ /压缩倍数压缩倍数 基础班多媒体技术声音的编码声音的编码一、第一、第1 1代全频带声音的压缩编码代全频带声音的压缩编码n最简单最基本的编码方法,其目标是使重建语音波形保持原波形的形状n它直接赋予取样点一个代码,没有进行压缩,因而所需的存储空间较大n n优点优点:音质好n n缺点缺点:数据量大n如:如:Audio CD采用PCM编码一张光盘的容量为72分钟左右的音乐信息基础班多媒体技术声音的编码声音的编码二、第二、第2 2代全频带声音的压缩编码代全频带声音的压缩编码1 1、MPEG-1MPEG-1声音压缩编码声音压缩编码n国际上第一个高保真声音数据压缩的
40、国际标准。分为三个层次:层层1(Layer 1)1(Layer 1):编码简单用于数字盒式录音磁带层层2(Layer 2)2(Layer 2):算法复杂度中等用于数字音频广播(DAB)和VCD、DVD等层层3(Layer 3)3(Layer 3):编码复杂用于互联网上的高质量声音的传输如:MP3音乐压缩10倍基础班多媒体技术声音的编码声音的编码名称名称压缩后的码率(每个声道)压缩后的码率(每个声道)声道数目声道数目主要应用主要应用MPEG-1层1384kbps(压缩4倍)2数字盒式录音带MPEG-1层2256192kbps(压缩68倍)2DAB,VCD,DVDMPEG-1层3128112kbp
41、s(压缩1012倍)2Internet,MP3音乐MPEG-2 audio与MPEG-1层1,层2,层3相同5.1,7.1同MPEG-1Dolby AC-364kbps5.1,7.1DVD,DTV,家庭影院几种典型的第几种典型的第2代全频带声音压缩编码标准代全频带声音压缩编码标准基础班多媒体技术数字音频的处理数字音频的处理一、语音合成一、语音合成(Speech synthesisSpeech synthesis)n根据语言学和自然语言理解的知识根据语言学和自然语言理解的知识,使,使计算机模仿人的发声,自动生成语音的计算机模仿人的发声,自动生成语音的过程过程n目前主要是按照文本(书面语言)进行目
42、前主要是按照文本(书面语言)进行语音合成,这个过程称为文语转换语音合成,这个过程称为文语转换(Text-To-Speech,简称,简称TTSTTS)基础班多媒体技术数字音频的处理数字音频的处理2、文语(、文语(TTS)转换过程)转换过程o文本分析o韵律分析o语音生成文本文本文本分析文本分析韵律处理韵律处理语音合成语音合成合成合成语音语音词典,发音规则词典,发音规则韵律规则库韵律规则库语音库语音库基础班多媒体技术数字音频的处理数字音频的处理二、音乐合成二、音乐合成1、MIDI 音音乐设备数字接口数字接口(Musical Instrument Digital Interface)n计算机中描述乐谱
43、的一种标准描述语言nMIDI文件的扩展名为 .MID,它是计算机合成音乐的交换标准,也是商业音乐作品发行的标准基础班多媒体技术数字音频的处理数字音频的处理2、播放、播放MIDI音音乐的的过程程o媒体播放器软件从磁盘上读入MID文件o把其中的一个个MIDI消息发送给声卡上的音乐合成器o由音乐合成器解释并执行MIDI消息所规定的操作o合成出各种音色的音符,通过扬声器播放出乐曲来基础班多媒体技术数字音频的处理数字音频的处理3、MIDI音音乐与高保真的波形声音相比与高保真的波形声音相比o缺点:缺点:n音质方面较差n无法合成出所有各种不同的声音(例如语音)o优点:优点:n数据量很少(比CD-DA少3个数
44、量级,比MP3少2个数量级)n易于编辑修改n可以与波形声音同时播放基础班多媒体技术4 数字视频及应用数字视频及应用基础班多媒体技术基本概念基本概念一、帧 动态图像由不断变化的静态图像形成。 每一幅静态的图像,称为一帧(frame)。二、扫描 1.水平扫描:扫描点从画面左侧匀速向右移动 垂直扫描:水平扫描线,按均匀间隔在垂直 方向上移动。 2. 隔行扫描 逐行扫描基础班多媒体技术基本概念基本概念三、彩色电视制式三、彩色电视制式1 1、NTSCNTSC正交平衡正交平衡调幅技幅技术2 2、PALPAL制制式式(中中国国采采用用)逐逐行行倒倒相相正正交平衡调幅交平衡调幅 远距离传输时用亮度信号远距离传
45、输时用亮度信号Y Y和两个色度信号和两个色度信号U U、V V来表示,优点:来表示,优点:o能与黑白电视接收机保持兼容能与黑白电视接收机保持兼容o可可利利用用人人眼眼对对两两个个色色度度信信号号不不太太灵灵敏敏的的视视觉特性来节省电视信号的带宽和发射功率觉特性来节省电视信号的带宽和发射功率o克克服服了了NTSC制制相相位位敏敏感感造造成成色色彩彩失失真真的的缺点缺点 基础班多媒体技术视频数字化视频数字化o视频(video)n由一幅幅单独的画面(称为帧frame)序列组成,这些画面以一定的速率(帧率fps,即每秒显示帧的数目)连续的透射在屏幕上,使观察者具有图像连续运动的感觉 n常见的视频:电视
46、电视 & 计算机动画计算机动画o电视:能传输和再现真实世界的图像与声音,是当代最有影响力的信息传播工具o计算机动画:是计算机制作的图像序列,是一种计算机合成的视频基础班多媒体技术oo运动图像压缩编码标准运动图像压缩编码标准名称名称源图像格式源图像格式压缩后的码率压缩后的码率主要应用主要应用MPEG-1CIF格式大约1.2Mb/s1.5Mb/s适用于VCD、数码相机、数字摄像机等H.261CIF格式,QCIF格式P64Kb/s(P=1、2时,只支持QCIF格式,P6时,可支持CIF格式)应用于视频通信,如可视电话、会议电视等MPEG-2(MPML)7205765Mb/s15Mb/s用途最广,如D
47、VD,150路卫星电视直播,540路CATV等MPEG-2High Profile144015521920115280Mb/s100Mb/s目标是高清晰度电视(HDTV)领域MPEG-4(H.324)多种不同的视频格式与MPEG-1,MPEG-2相当,但最低可达到64Kb/s适合于交互式多媒体应用,包括虚拟现实、远程教学、交互式电视等视频的压缩编码视频的压缩编码基础班多媒体技术一、数字电视一、数字电视 将电视信号进行数字化, 然后以数字形式进行编辑、制作、传输、接收和播放。数字电视的特点:数字电视的特点:o频道利用率高、图像清晰度好o可以开展交互式数据业务,包括实时点播电视、电视购物、电视银行、电视商务、电视通信、电视游戏、电视网上游览、观众参与的电视竞赛等。数字视频的应用数字视频的应用基础班多媒体技术二、点播电视(二、点播电视(VODVOD)VOD(Video On Demand) 视频点播技术(交互式电视点播系统)o用户可以根据自己的需要收看电视节目数字视频的应用数字视频的应用基础班多媒体技术o谢谢!基础班多媒体技术