数字媒体与应用(new)

上传人:san****019 文档编号:70238139 上传时间:2019-01-16 格式:PPT 页数:142 大小:6.17MB
返回 下载 相关 举报
数字媒体与应用(new)_第1页
第1页 / 共142页
数字媒体与应用(new)_第2页
第2页 / 共142页
数字媒体与应用(new)_第3页
第3页 / 共142页
数字媒体与应用(new)_第4页
第4页 / 共142页
数字媒体与应用(new)_第5页
第5页 / 共142页
点击查看更多>>
资源描述

《数字媒体与应用(new)》由会员分享,可在线阅读,更多相关《数字媒体与应用(new)(142页珍藏版)》请在金锄头文库上搜索。

1、第5章 数字媒体及应用,5.1 文本与文本处理 5.2 图像与图形 5.3 数字声音及应用 5.4 数字视频及应用,教学目的与要求,掌握GB2312字符集的内容及其在计算机内的表示,熟悉GBK字符集和GB18030字符集的内容,了解UCS/Unicode的目的及其与GB18030标准的关系 了解字符信息输入计算机的方法与分类,了解汉字键盘输入编码的方案及其优缺点 熟悉计算机文本的不同类型、特点、用途和它们的文件扩展名,熟悉简单文本(纯文本)和丰富格式文本的特点,掌握超文本的特点,了解链源、链宿和超链的概念,了解Windows环境中编辑制作各种类型文本的常用软件及其应用,了解什么是计算机文本处理

2、 掌握图像获取(数字化)的原理与主要步骤,掌握黑白图像、灰度图像和彩色图像在计算机中表示方法的区别,掌握数字图像的主要性能参数(分辨率、像素深度)以及它们与图像大小、颜色数目、图像数据量之间的关系,了解图像数据压缩的意义和两类压缩方法,熟悉几种常用的数字图像文件格式以及它们的特点和用途,了解数字图像处理的主要内容和用途,了解计算机图形与图像的区别和联系、计算机图形的应用,教学目的与要求,掌握波形声音获取(数字化)的原理与主要步骤,熟悉波形声音获取设备(如麦克风、声卡)的功能,了解计算机输出(播放)声音时的工作过程与相关设备 熟悉波形声音的主要性能参数(取样频率、量化位数、声道数目)及其与码率和

3、数据量之间的关系,了解波形声音的特性、常用的文件类型及其应用,了解CD立体声和MP3的特性和应用; 了解计算机合成语音(文语转换)的过程和主要应用,熟悉计算机合成音乐(MIDI)的特点与应用 了解数字视频获取设备的功能和特点,熟悉数字视频的压缩编码标准及其应用,熟悉VCD和DVD的特点和应用,了解可视电话和视频会议的基本原理和应用,了解什么是数字电视和数字电视的传播方式,了解点播电视(VOD)的功能,5.1 文本与文本处理,5.1.1 字符的编码 5.1.2 文本准备 5.1.3 文本的分类 5.1.4 文本编辑、排版与处理 5.1.5 文本的展现,文字处理是计算机应用的基础,计算机应用使用计

4、算机进行信息处理,其中,文字信息的处理是各种计算机应用的基础,传统的文字处理过程,计算机文字处理过程,文字信息在计算机中称为“文本”(text),文本是计算机中最常用的一种数字媒体 文本由一系列 “字符”(character)组成,每个字符均使用二进制编码表示 文本在计算机中的处理过程是:,5.1.1 字符的编码 (在计算机中的表示 ),字符、字符集及其码表,文字的基本元素是字母和符号,统称为“字符” (character),它包括:字母、数字、符号等 字符集:一组特定字符的集合 不同的字符集包含的字符数目与内容不同,如: 中文字符集、西文字符集、日文字符集等 字符的编码: 字符集中每个字符都

5、使用二进位(code) 表示,称为该字符的编码 不同的字符其编码各不相同 字符集中所有字符的编码的一览表,称为该字符集的码表,西文字符的编码ASCII码,西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符号所组成 美国标准信息交换码(American Standard Code for Information Interchange, 简称ASCII码): ASCII字符集包含96个可打印字符和32个控制字符 采用7个二进位进行编码 计算机中使用1个字节存储1个ASCII 字符 有关介绍可参看第1章1.2.3节,汉字如何编码?,汉字是记录汉语(国语,华语)的文字,属于表意文

6、字,它用符号直接表达词或词素 汉字的特点 数量大;多个国家和地区使用;字形复杂,同音字多,异体字多 如何编码? 确定收入多少字、哪些字? 汉字在字符集中的排序方式 确定使用的代码结构和代码空间,常用的汉字编码字符集,国家标准GB2312-1980 汉字扩充规范 GBK (已被GB 18030取代) 国家标准GB18030-2005 港澳台使用的汉字编码字符集CNS 11643 (BIG 5,俗称“大五码”) UCS/Unicode多文种大字符集 Unicode的UTF-8 Unicode的UTF-16,GB2312汉字编码字符集,1980年颁布信息交换用汉字编码字符集基本集GB2312-198

7、0 GB2312字符集由三个部分构成:,拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个,共6763个汉字和682个符号,每个汉字和符号都有一个确定位置,GB2312汉字的编码,每一个GB2312汉字使用16位(2个字节)表示 每个字节的最高位均为“1” 机内码(又称内码):这种高位均为1的双字节汉字编码 例如“南”字的GB2312内码为: 11000100 11001111(16进制表示为C4CF) 汉字内码与ASCII字符二进制表示有明显的区别,第1字节,第2字节,图 GB2312汉字在计算机中的表示,有一段文本的机内码:AB F5 80 94 CA D7 70 62 B

8、6 C8,则在这段文本中含有_。,A1个汉字和8个西文字符 B2个汉字和6个西文字符 C3个汉字和4个西文字符 D4个汉字和2个西文字符,题解,若内存中相邻2个字节的内容为十六进制74 51,则它们不可能是_。,A.2个西文字母的ASCII码 B.1个汉字的机内码 C.1个16位整数 D.一条指令的组成部分,题解,GBK汉字内码扩充规范,GB2312的不足: 汉字字数太少,没有繁体字,无法满足人名、地名、古籍整理、古典文献研究等应用的需要;与ASCII码不兼容 GBK汉字内码扩充规范(1995): 在GB2312基础上,增加了1万多汉字(包括繁体字)和符号 共有21003个汉字和883个图形符

9、号,如“計算機”、冃、冄、円、冇等繁体字和生僻字 包含了中、日、韩认同的全部CJK汉字; 与GB8312保持向下兼容,也使用双字节表示,第1字节最高位必须为“1”,第2字节的最高位不一定是“1”:,UCS/Unicode与GB18030汉字编码标准,国际标准化组织(ISO)制定的一个将全世界现代书面文字所使用的所有字符和符号(包括中国大陆和港台地区、日本、韩国等使用的汉字在内,大约10万字符)集中进行统一编码,称为UCS标准,对应的工业标准称为Unicode GB18030汉字编码国家标准:一方面与GB2312和GBK保持向下兼容,同时还扩充了UCS/Unicode中的其他字符,与其接轨,GB

10、18030汉字编码标准,我国在2000年和2005年两次发布GB18030汉字编码国家标准。 GB18030实质上是UCS/Unicode字符集的另一种编码方案: 单字节编码(128个)表示ASCII字符 双字节编码(23940个)表示汉字,与GBK(以及GB2312)保持向下兼容,GBK不再使用 四字节编码(约158万个)用于表示 UCS/Unicode中的其他字符 GB18030目前已在我国信息处理产品中强制贯彻执行。,几种汉字编码的对比,例: IE浏览网页时文字编码的选择,下面是关于我国汉字编码标准的叙述,其中正确的是_。 AUnicode是我国最新发布的也是收字最多的汉字编码国家标准。

11、 B汉字在计算机中的存储编码是机内码 C在GB2312汉字编码国家标准中,共有2万多个汉字。 DGB18030与GB2312和GBK汉字编码标准不兼容。 E. 在GB2312汉字编码国家标准中,同一个汉字的不同造型 (如宋体、楷体等)在计算机中的机内码相同。 F. 在最新的汉字编码国家标准中,同一个汉字的不同字形 (如简体和繁体)在计算机中的内码不同。 G.3种标准保持向下兼容,并与我国台湾地区发布和使用 的BIG-5兼容。 H. GBl8030标准中收录的汉字数目超过2万,Windows XP操作系统支持该标准,5.1.2. 文本准备 文稿如何输入计算机,文字符号输入计算机的方法,键盘输入,

12、(1)数字编码, 如电报码、区位码等, (2)字音编码, 如智能ABC等 (3)字形编码,如五笔字形和表形码等, (4)形音编码 发展趋势:基于统计和学习功能的以词语(短语)或句子作为输入单位的输入方法,文字符号输入计算机的方法,优点: 自然,流畅 小型化,适合移动计算 不足: 识别速度和正确性还需提高 书写要求还要降低,文字符号输入计算机的方法,优点: 自然,方便,适合移动计算 不足: 对说话人、说话方式、说话内容的适应能力要大大增强 识别速度和正确性还需大大提高,文字符号输入计算机的方法,识别率已达到98% 功能: 简、繁体字混合识别 中文、西文混合识别 文字、表格混合识别 智能校对功能,

13、文字符号输入计算机的方法,技术上非常困难,还无法实用 目前准备先突破工整的楷书手写体的识别!,汉字的键盘输入,汉字与键盘上的键无法一一对应,因此必须使用几个键来表示一个汉字,这就称为汉字的“键盘输入编码” 优秀的汉字键盘输入编码应具有的特点: 易学习、易记忆 效率高(平均击键次数较少) 重码少 容量大(可输入的汉字字数多),汉字键盘输入方法的比较,5.1.3 文本的分类,简单文本(纯文本 ),没有字体、字号的变化,不能插入图片、表格,也不能建立超链接,其文件后缀名是 .txt 由一串用于表达正文内容的字符编码所组成,几乎不包含任何其他的格式信息和结构信息 举例:,丰富格式文本,本书由南京大学出

14、版社(Publishing House of Nanjing University)出版,有字体字号等属性变化、设置了段落和页面排版格式的文本称为“丰富格式文本” 丰富格式文本中,除了正文内容之外,还使用了许多“标记”来描述字符的属性和格式的设置。 举例:下面标题的格式为:中文用黑体,西文用Arial Black体,居中,使用HTML语言描述为:,本书由南京大学出版社(Publishing House of Nanjing University)出版,用一对指出的是标记,如 和 等,用于说明排版的格式和文字属性,它们不属于正文内容,正文内容,超文本,若干文本或文本中的各个部分可按照其内容的关系

15、互相链接起来,从而形成 “超文本”,“超链”实际上就是一个指针,用于指向其他文本块,也可以指向同一文本块中的其他部分,超链是有向的,起点位置称为链源,它可以是文本块中的一个标题、一句句子、一个关键词、一幅画、一个图标等,文本块可以是一个网页,一个文档,一段文字,也可以是一张图片,甚至一段声音或视频,小结:文本的分类,5.1.4 文本编辑、排版与处理,复习:使用Word的操作流程,创建新文档或打开老文档,文稿输入,编辑,排版,文档存盘、打印或发送,输入中西文字、符号和图表,进行增、删、改操作,保证文本的正确性,满足清晰、美观、便于使用等要求,目的:确保文本内容正确无误 操作:对字、词、句和段落进

16、行添加、删除、修改等操作 MS Word的功能: 在文本的任何位置都可以插入新的文字 从文本的任何位置都可以删除不需要的文字 将一段文字从一处移动到另一处 将一段文字从一处复制到另一处 在文本中自动查找指定的词语 用一个词语自动替换文本中指定的词语,文本编辑(text editing),目的:使文本清晰、美观、便于阅读 操作内容:对文本中的字符、段落乃至整篇文章的格式进行设计和调整,分成3个层次: 对字符格式进行设置 对段落格式进行设置 对文档页面进行格式设置,文本排版(格式化),设置字符的格式,字号(八号 初号, 5磅72磅以上) 1磅相当于1/72英寸 字体(宋体、楷体、黑体、仿宋、隶书) 字符的修饰 字符的形状(字形):正常、加粗、倾斜、加粗倾斜 字形的修饰:下划线、着重号、上下标、删除线 字符的颜色 字符的宽度 字符的间距 字符的效果 字符的排列方向,什么是段落?用“回车”相互隔开的一组文字 段落格式的设置: 段落的对齐方式(两端对齐、分散对齐、居中对齐、左对齐、

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号