计算机专转本辅导数字媒体应用

上传人:宝路 文档编号:48348194 上传时间:2018-07-14 格式:PPT 页数:91 大小:2.59MB
返回 下载 相关 举报
计算机专转本辅导数字媒体应用_第1页
第1页 / 共91页
计算机专转本辅导数字媒体应用_第2页
第2页 / 共91页
计算机专转本辅导数字媒体应用_第3页
第3页 / 共91页
计算机专转本辅导数字媒体应用_第4页
第4页 / 共91页
计算机专转本辅导数字媒体应用_第5页
第5页 / 共91页
点击查看更多>>
资源描述

《计算机专转本辅导数字媒体应用》由会员分享,可在线阅读,更多相关《计算机专转本辅导数字媒体应用(91页珍藏版)》请在金锄头文库上搜索。

1、第5章 数字媒体及应用5.1 文本与文本处理 5.2 图像与图形 5.3 数字声音及应用5.4 数字视频及应用5.1 文本与文本处理 5.1.1 字符的编码5.1.2 文本准备5.1.3 文本的分类5.1.4 文本编辑、排版与处理5.1.5 文本的展现 文字处理是计算机应用的基础l计算机应用使用计算机进行信息处理l其中,文字信息处理是涉及面最广的一种计算 机应用,几乎与任何领域任何人都有关。文字数值语言音乐图像信息的形态有多种写作编辑排版印刷发行写作传统的文字处理过程计算机文字处理过程l文字信息在计算机中称为“文本”(text),文本是计算机中 最常用的一种数字媒体l文本由一系列 “字符”(c

2、haracter)组成,每个字符均使用二 进制编码表示l文本在计算机中的处理过程是:(文本编辑器)文本编辑 与排版格式化的 电子文本(2)文本 展现(文本阅读器)(5)文本处理(文本处理软件)(3)文本准备电子文 本(1)(文字与图表的输入)文本存储 与传输(4)(存档/通信软件 )5.1.1. 字符在计算机中的表示 一、西文字符的编码ASCII码l西文是表音文字(拼音文字),它由拉丁字母、数字、标 点符号以及一些特殊符号所组成l美国标准信息交换码(ASCII码):lASCII字符集包含96个可打印字符和32个控制字符l采用7个二进位进行编码l计算机中使用1个字节存储1个ASCII 字符l存在

3、问题:l字符集太小(只有128个字符)l不同国家和地区使用不同的字符集及其编码,互不兼容l东亚地区使用的大字符集无法编码0X X X X X X X一级汉字 (3755个)二级汉字 (3008个)(扩充使用)字母、数字和各种符号19423位号 1 9 1655 568794区 号(按汉语拼音排列)(按偏旁部首排列)GB2312汉字编码字符集l1980年颁布信息交换用汉字编码字符集基本集(我国第一个 国家标准)GB2312-1980lGB2312字符集由三个部分构成:拉丁字母、俄文 、日文平假名与 片假名、希腊字 母、汉语拼音等 共682个共6763个汉字和 682个符号,每个汉字和符号都有一

4、个确定位置区位码:GB2312国标字符集构成一个二维平面,它 分成94行、94列,行号称为区号,列号称为位号。 问题:文本中的汉字与西文字符易与单字节的标准 ASCII码混淆不清。 例如:“大”字的区号20,位号83,区位码是20 83, 用2个字节表示为:00010100 01010011(1453H)。这种高位为 l 的双字节(16位)汉字编码就称为 GB2312汉字的“机内码”,又称内码。例如:“大”字的 内码是:10110100 11110011(B4F3)。汉字的区位码、国标码、机内码的关系:国标码=区位码+2020H机内码=国标码+8080H机内码=区位码+A0A0H汉字机内码双字

5、节,最高位是1;西文字符机内码单字节,最高位是0。GBK汉字内码扩充规范 lGB2312的不足:l汉字字数太少,缺少繁体字,无法满足人名、地名、古籍整 理、古典文献研究等应用的需要;与ASCII码不兼容lGBK汉字内码扩充规范(1995):l在GB2312基础上,增加了1万多汉字(包括繁体字)和符号l共有21003个汉字和883个图形符号,如“計算機”、冃、冄 、円、冇等繁体字和生僻字 l与GB8312保持向下兼容,也使用双字节表示,第1字节最 高位必须为“1”:1X第1字节第2字节X X X X X X XX X X X X X XUCS/Unicode多文种大字符集l背景:为了实现全球数以

6、千计的不同语言文字的统一编码l方案:ISO将全球所有文字字母和符号集中在一个字符集中进行统 一编码(目前共收集了17x2161,114,112 个) ,称为UCS/UnicodelUCS/Unicode的编码方案:l先实现部分字符的编码(共107,361个字符)l尽量与已有编码标准兼容l其中包含有中、日、韩统一整理出来的近3万汉字(CJK汉字)l允许有若干不同的编码方案, 例如:GB18030汉字编码标准l背景:无论是Unicode的UTF-8还是UTF-16,其CJK汉字字符集虽 然覆盖了我国已使用多年的GB2312和GBK标准中的汉字,但它们的编码并不相同l为了既能与UCS/Unicode

7、编码标准接轨,又能保护我国已有的大 量汉字信息资源,我国在2000年和2005年两次发布GB18030汉字编码国家标准。lGB18030实质上是UCS/Unicode字符集的另一种编码方案:l单字节编码(128个)表示ASCII字符l双字节编码(23940个)表示汉字,与GBK(以及GB2312)保持向下兼 容,GBK不再使用l四字节编码(约158万个)用于表示 UCS/Unicode中的其他字符lGB18030目前已在我国信息处理产品中强制贯彻执行。 标准名 称GB2312GBKGB 18030UCS-2 (Unicode)字符集6763个汉字( 简体字)21003个汉字( 包括GB2312

8、汉 字在内)近3万汉字 (包括GBK汉字 和CJK及其扩 充中的汉字)包含10万多字符, 其中的汉字与 GB18030相同编码方 法双字节存储和 表示,每个字 节的最高位均 为“1” 双字节存储和 表示,第1个字 节的最高位必 为“1”部分双字节、 部分4字节表 示,双字节表 示方案与GBK 相同(1) UTF-8采用 单字节可变长编码(2) UTF-16采用 双字节可变长编码兼容性编码 不兼容!小结:几种汉字编码的对比编码保持向下兼容5.1.3 文本的分类简单文本(纯文本 ) 没有字体、字号的变化,不能插入图片、表格,也不能建立超 链接,其文件后缀名是 .txt 由一串用于表达正文内容的字符

9、编码所组成,几乎不包含任何其他的格式信息和结构信息丰富格式文本本书由南京大学出版社(Publishing House of Nanjing University)出版 有字体字号等属性变化、设置了段落和页面排版格式的文本称为“丰富格 式文本” 丰富格式文本中,除了正文内容之外,还使用了许多“标记”来描述字符的 属性和格式的设置。 举例:下面标题的格式为:中文用黑体,西文用Arial Black体,居中 使用HTML语言描述为: 本书由南京大学出版社(Publishing House of Nanjing University)出版用一对指出的是标记,如 和 等,用于说明排版的格式和文字属性,

10、它们不属于正文内容正文内容超文本l若干文本或文本中的各个部分可按照其内容的关系 互相链接起来,从而形成 “超文本”ABCDEFGHa1a2b2c2f1d1c1b1e1g1h1a3“超链”实际上就是一 个指针,用于指向其 他文本块,也可以指 向同一文本块中的其 他部分 超链是有向的,起点位置 称为链源,它可以是文本 块中的一个标题、一句句 子、一个关键词、一幅画 、一个图标等文本块可以是一个 网页,一个文档, 一段文字,也可以 是一张图片,甚至 一段声音或视频 小结:文本的分类 文本 类型特点 在计算机内的表示文件 扩展名用途简单 文本没有字体、字号和版 面格式的变化,文本 在页面上逐行排列,

11、也不含图片和表格由一连串与正文内容对 应的字符的编码所组成 ,几乎不包含任何其他的 格式信息和结构信息.txt网上聊天 短信 文字录入 OCR输 入丰富 格式 文本( 线性 文本)有字体、字号、颜色 等变化,文本在页面 上可以自由定位和布 局,还可插入图片和 表格除了与正文对应的字符 编码之外,还使用某种“ 标记语 言”所规定的一些 标记来说明该文本的文 字属性和排版格式等.doc .rtf .htm .html .pdf公文 论文 书稿 网页丰富 格式 文本( 超文 本)除上述特征外,文本 中还含有超链,使文 本呈现为一种网状结 构同上,但还应包含用于指 出“链源”和“链宿”的标记.doc

12、.rtf .htm .html .pdf .hlp同上,以 及软件的 联机文档( 帮助文件)真题讲解一、选择题1、在下列字符中,其ASCII码值最大 的一个是 。 (2005年)A、 X B、 6 C、 5 D、 Y答案:D2、下列汉字编码标准中,不支持繁体汉 字的是 。(2007年)A.GB2312-80 B.GBKC.BIG5 D.GB18030答案:A3、在ASCII编码中,字母A的ASCII编码 为41H,那么字母f的ASCII编码为_。(2008年)A46H B66H C67H D78H答案:B4、不同的文本处理软件使用的格式控制 和结构说明信息并不统一,不同的丰富格式 文本互不兼容

13、,因此一些公司联合提出了一 种中间格式,称为_格式。 、(2008年)ADOC BPDF CHTML DRTF 答案:D5、根据ASCII码值的大小,下列表达式 中,正确的是 。 (2009年)A. “a” “A” “9” B. “A” “a” “9”C. “9” “a” “A” D. “9” “A” “a”答案:D6、已知“江苏”两字的区位码是“2913”和 “4353”,则其机内码是 。(2009年)A. 3D2D和4B55 B.4535和535DC.6145和7585 D.BDAD和CBD5 答案:D7、若内存中相邻2个字节的内容为十六 进制74 51,则它们不可能是_。(2010年)A

14、1条指令的组成部分 B1个汉字的机内码C1个16位整数 D2个英文字母的ASCII码答案:B三、填空题1、 1KB的内存空间能存储512个汉字内码,约存个2424点阵汉字的字形码。 (2005年)2、在中文Windows环境下,西文使用标准ASCII 码,汉字采用GB2312 编码,现有一段文本的内码为 :AB F4 D1 E3 78 C2 B7 55, 则在这段文本中,含有的汉字和西文字符的个数分别是_。(2006 年)答案:14答案:3、2四、判断题1、每个汉字的机内码都用两个字节存储 。 (2005年)2、只要是在同一个字符集下,文本的输 出所使用的字库都是相同的。 (2009年) 答案

15、:T答案:F4、在ASCII码表中,数字和英文字母按 照ASCII码值从小到大排列的顺序为:数字 、大写字母、小写字母。 (2008年) 答案:T5.2 图像与图形5.2.1 数字图像的获取5.2.2 图像的表示与压缩编码5.2.3 数字图像处理与应用5.2.4 计算机图形5.2.1 数字图像的获取图像的获取过程扫 描模 拟 图 像取 样取 样取 样数字图像分 色量 化量 化量 化l从现实世界中获得数字图像的过程称为图像的“获取”l常用的图像获取设备:扫描仪、数码相机、摄像头、摄像机 等l图像获取过程: 将画面划分为 M N个网格,每 个网格称为 一 个取样点 将彩色图像取样 点的颜色分解成 R,G,B

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号