计算机中的文字表达方式

上传人:宝路 文档编号:47967418 上传时间:2018-07-07 格式:PPTX 页数:11 大小:232.17KB
返回 下载 相关 举报
计算机中的文字表达方式_第1页
第1页 / 共11页
计算机中的文字表达方式_第2页
第2页 / 共11页
计算机中的文字表达方式_第3页
第3页 / 共11页
计算机中的文字表达方式_第4页
第4页 / 共11页
计算机中的文字表达方式_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《计算机中的文字表达方式》由会员分享,可在线阅读,更多相关《计算机中的文字表达方式(11页珍藏版)》请在金锄头文库上搜索。

1、计算机中的文字表达方式计算机中的文字表达方式1.ASCII码 2.GB2312编码 3.Big5编码 4.Unicode编码 5.输入编码 6.字型码一一. .文字表达方式的种类文字表达方式的种类 1.ASCII1.ASCII码码ASCII(American Standard Code for Information Interchange,美国信息互换 标准代码)是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语和其 他西欧语言。它是现今最通用的单字节编码2010年12月8日叫基础ASCII码,使用 7 位二进制数来表示所有的大写和小写字母,数字 0 到 9、标点符号,以及在美 式英语

2、中使用的特殊控制字符。ASC11码编码的编码规则是在下表中确定的,它 是一种约定顺序编码,每个字符在ASC11码表中的顺序号成为字符的ASC值,它 有两种形式,一种包含128个字符,另一种包含256个字符。包括128个字符的 ASC码表,ASC值范围是0127,计算机中使用7个二进制位就可以表示,因此称 为7位二进制码。包含256个字符的ASC码表,在7位码表的基础上,增加了对128 个字符的支持。国际上7位ASC码有广泛的支持,对8位ASC11值支持程度较弱 , 尤其在中文环境下因为同汉字的存储编码相冲突,8位ASC11码值不被支持。在7位ASC11码值中,字符总体上分为两大类:控制字符和可

3、显示字符。控 制字符用于显示、打印、警告或传输过程和解释,在频幕上不显示,其 ASC11值得范围是031及127。可显示字符则同英文中出现的各种字母和个 符号相对应,涵盖了英文所需要的所有文字符号,其ASC11值范围是 32126,可细分为以下几大类:英文字符,ASC11值范围是3247、5864 、9196及123126;数字字符,ASC11值是4857;大写英文字母, ASC11值是6590;小写英文字母,ASC11值范围是97122.2.GB23122.GB2312编码编码GB 2312或GB 2312-80是一个简体中文字符集的中国国家标准,全称为信 息交换用汉字编码字符集基本集,又称

4、为GB0,由中国国家标准 总局发布 ,1981年5月1日实施。GB2312编码通行于中国大陆;新加坡 等地也采用此 编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。 GB 2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个; 同时,GB 2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字 母、俄语西里尔字母在内的682个全角字符。ASC11码值得出现有效的解决了 西文文字的信息化问题,但对于汉字字符却完全不适用,为了满足国内在计 算机中使用文字的需要,中国国家标准总局发布了一系列的汉字字符集国家 标准编码,统称为GB码或国标码,其中最有影响

5、的是与1980年发布的信息 交换用汉字编码字符集 基本集,标准号为GB2312-1980.因其使用非常普 遍,也常被统称为国标码.GB2312是一个简体中文字符集,由6763个常用汉字和682个全角的非汉字字 符组成,其中汉字根据使用的频率可分为两级。一级汉字3755个,二级汉字 3008个。由于字符数量比较大,GB2312采用了二维矩阵编码法对所有字符 进行编码。首先构造一个94列的方阵,对每一行成为一个“区”,每一列称 为一个“位”,然后将所有字符依照下表的规律填写在方阵中。这样所有的 字符在方阵中都有一个唯一的位置,这个位置可以用区号、位号合成表示, 称为字符的区位码。因为区位码同字符的

6、位置是完全对应的,因此区位码同 字符之间也是一一对应的。3.BIG53.BIG5编码编码 “大五码”(Big5)是在1984年由台湾13家厂商与台湾地区 财团法人信息工业策进会为五大中文套装软件所设计的中文 内码,所以就称为Big5中文内码,虽然五大套装软件并没有 成功,但Big5码却深远地影响中文电脑内码,直至今日。“五 大码”的英文名称“Big5”后来被人按英文字序译回中文,以 致现在有“五大码”和“大五码”两个中文名称。大五码是一种繁体中文汉字字符集,其中繁体汉字13053个 ,808个标点符号,希腊字母及特殊符号。大五码的编码码 表直接针对存储而设计、每个字符统一使用两个字节存储表 示

7、。第一字节范围81HFEH,避开了同ASCII码的冲突,第二 字节范围是40H7EH和A1HFEH,在同一正文不能对两种字 符集的字符同时支持。BIG5BIG5编码的字符编码分布表编码的字符编码分布表编码范围符号类别8140HA0FEHA140HA3BFHA3C0HA3FEHA440HC67EHC6A1HC6FEHC940HF9D5HF9D6HFEFEH保留(用作造字区)标点符号、希腊字母及特殊符号保留(未开放用于造字区)标点符号、希腊字母及特殊符号保留(用作造字区)非常用汉字(先按笔画,再按部首 排列)保留(用作造字区)编码范围8140HA0FEH保留(用作造字区)A140HA3BFH标点符

8、号、希腊字母及特殊符号A3C0HA3FEH保留(未开放用于造字区)A440HC67EH常用汉字(先按笔画,再按部首排序)C6A1HC6FEH保留(用作造字区)C940HF9D5H非常用汉字(先按笔画,再按部首排列 )4.UNICODE4.UNICODE编码编码 Unicode字符集可以简写为 UCS(Unicode Character Set )。早期的 Unicode标准有UCS -2、UCS-4的说法。UCS-2用两 个字节编码,UCS-4用4个字节 编码。UCS-4根据最高位为0的 最高字节分成27=128个group 。每个group再根据次高字节分 为256个平面(plane)。每

9、Unicode是国际组织制定的可以 容纳世界上所有文字和符号的字 符编码方案。Unicode用数字0- 0x10FFFF来映射这些字符,最 多可以容纳1114112个字符,或 者说有1114112个码位。码位就 是可以分配给字符的数字。UTF -8、UTF-16、UTF-32都是将数 字转换到程序数据的编码方案。 UCS是一种字符集编码法, 主要用于计算机程序和操作系统 内部。在存储和传输中,往往不 直接使用UCS编码而是通 过一定的转换程序来实现。这些 转换编码最通用的是utf8和 utf16.由于大量使用的ASC11码 字符兼容所提出的UCS的一种实 现就是utf8.utf8就是采用变长

10、字节表示一个字符,尽管有节约 存储和传输资源的好处,但也同 时导致软件实现有困难。 平面根据第3个字节分为256 行 (row),每行有256个码位 (cell)。group 0的平面0被称 作BMP(Basic Multilingual Plane)。将UCS-4的BMP去掉 前面的两个零字节就得到了UCS- 2。五五 输入编码输入编码世界上使用汉字的人口约占世界总人口的 四 分之一,因此研究和发展汉字输入编码是一 项非常急迫的任务。中国是汉字的发源国, 汉字应用已有数千年历史。一九八七年中国 研究汉字输入编码的人员已近 四百人,不论 在深度和广度上,都走在世界前列。汉字从 形编码利用人们已

11、有的汉字书写知识,在键 盘上象写字一样打入笔画和字根,从计算机 内选出汉字,既直接又方便。 从音编码是以一九五八年 二月十一 日全国 人大批准公布的汉语拼音方案为基本编 码元素。汉语拼音是以北京语音为标准音, 以北方语为基础方言,以典范的白话文著作 为语法规范的普通话。自推广普通话以来, 已有相当数量的人掌握了汉语拼音,以此为 基础作汉字输入编码,为这部分人所乐于接 受。但中国各地方言复杂,不少人还难以做 到准确认读汉字,因此容易出现差错。6.6.字型码字型码 汉字字型码又称字字模,用于 汉字在显示屏或打印机输出。汉 字字型码通常有两种表示方式: 点阵和矢量表示方法。 用点阵表示字型时,汉字字

12、型 码指的是这个汉字字型点阵的代 码。根据输出汉字的要求不同, 点阵的多少也不同。简易型汉字 为16*16点阵,提高型汉字为 24*24点阵,32*32点阵,48*48 点阵等等。点阵规模愈大,字型 愈清晰美观,所占存储空间也愈 大 矢量表示方式存储的是描述汉 字字型的轮廓特征,当要输出汉 字时,通过计算机的计算,由汉 字字型描述生成所需大小和形状 的汉字点阵。矢量化字型描述与 最终文字显示的大小,分辨率无 关,因此可以产生高质量的汉字 输出。Windows中使用的 TrueType技术就是汉字的矢量表 示方式。二二. .文字输入到显示流程文字输入到显示流程 将字符写入一个MN的空白方格中,对

13、表格中每个方格用 一个比特(Bit)来表示,字符通过的方格用“1”表示,未 通过的方格用“0”来表示,这样将每个方格的值按照从左到 右,从上到下的顺序写下来,就形成了字符的点阵字型码。 显示汉字时,则执行相反的过程,对于点阵字形为“0”的比 特,在频幕中像素显示为背景色,而为“1”的比特,则显示 为前景色。 根据点阵编码时使用的表格大小,常用的汉字点阵字库一 般分为16点阵、24点阵、32点阵等格式。每个汉字码占( MN)/8个字节数。 点阵字型码显示汉字的熟读很快,但在进行放大时由于 使用字块填充,会出现明显的锯齿边缘。因此点阵字库一边 不用于图形环境 ,常用在字符操作界面中。 1.点阵编码

14、法文字文字输入到显示流程输入到显示流程 2.矢量编码法文字字符的字形信息都是由多个笔画子图形组成的,适量编 码发将组成的字符每一笔画用一组直线勾勒,然后按一定顺 序对各笔画一体组适量来表示.显示汉字是,首先从矢量库中 检索字型码。矢量编码法所占存储空间的字节数不是固定的,取决于字符 本身的复杂度,一般来讲,所含笔画越多,笔画越复杂的字 符,字型码所占空间越大。 矢量字符在显示时,需要进行大量的矢量计算,耗费时间要 长一些。但矢量字形方法是以几何方法精确勾画轮廓的,因 此具有无级缩放的优点。目前,矢量字形广泛应用在各种图 形用户界面的系统以及文本的打印输出环境。计算机中的文字计算机中的文字表达方式表达方式完

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号