汉字信息计在算机内部的表示

上传人:宝路 文档编号:47896549 上传时间:2018-07-06 格式:PPT 页数:38 大小:1.55MB
返回 下载 相关 举报
汉字信息计在算机内部的表示_第1页
第1页 / 共38页
汉字信息计在算机内部的表示_第2页
第2页 / 共38页
汉字信息计在算机内部的表示_第3页
第3页 / 共38页
汉字信息计在算机内部的表示_第4页
第4页 / 共38页
汉字信息计在算机内部的表示_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《汉字信息计在算机内部的表示》由会员分享,可在线阅读,更多相关《汉字信息计在算机内部的表示(38页珍藏版)》请在金锄头文库上搜索。

1、第二章 汉字信息在计算机内部表示主要内容: 英文字符在计算机内部的表示 中文信息在计算机中的表示 汉字代码体系 汉字的排序 汉字编码字符集Evaluation only.Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd.Copyright 2004-2011 Aspose Pty Ltd.2

2、.1 英文字符在计算机内部的表示n1.ASCII码nASCII码(America Standard Codefor for Information Interchange)美国信息交换标准码,作为数据传输的标 准码。早期使用7 个位来表示英文字母、数字09及其它 符号,现在则使用8个位,最多可以给256个字符(包括字 母、数字、标点符号、控制字符及其他符号)分配(或指定 )数值。 Evaluation only.Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Created with

3、 Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd.Copyright 2004-2011 Aspose Pty Ltd.nASCII码字符标准中用7位二 进制数定义了128个字符, 其中94个为图形字符,32个 为控制字符,1个为空格字 符和一个Del键。nASCII的编码空间如图所示 ,图中把7位二进制数分为 高3位作为列号,低4位作为 行号,并用十六进制表示, 从而组成了一个ASCII编码 空间。012345670控 制 字 符 区1图形字符区23456789ABCD

4、EFEvaluation only.Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd.Copyright 2004-2011 Aspose Pty Ltd.n2.扩展ASCII码n 由于ASCII码只能表示94个字符,因此若需要使计算机还能够处理其他西文(如德文、法文、西班牙文等),则 必须

5、对ASCII码进行扩充。n 最简单的方式是采用8位二进制编码来表示一个扩展的ASCII码字符集。n 扩展ASCII码的编码空间如图所示。n GL图形区用作ASCII码,GR图形字符区为其他一个西方国家的语言文字编码。Evaluation only.Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty L

6、td.Copyright 2004-2011 Aspose Pty Ltd.0123456789ABCDEF 0C0控制 字符区C1控制 字符区1GL图形字符区GR图形字符区 2 3 4 5 6 7 8 9 A B C D E FEvaluation only.Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspos

7、e Pty Ltd.Copyright 2004-2011 Aspose Pty Ltd.n 为了尽可能多地使得英文与其他西方语言文字系统兼容,国际化组织在ISO8859的第110部分中定义了新增128 个码元的字符编码集。n 这10个部分分别定义了ASCII码和其扩展字符集。不同的扩展字符集用ISO8859后跟不同的数字表示。n 扩展ASCII码采用高4位作列号,低4位作行号。 Evaluation only.Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Created with

8、 Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd.Copyright 2004-2011 Aspose Pty Ltd.Evaluation only.Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-201

9、1 Aspose Pty Ltd.Copyright 2004-2011 Aspose Pty Ltd.n3.CJK-Roman n CJK-Roman是指在中日韩字符编码标准中开发的ASCII码 ,分别是GB-Roman、CNS-Roman、JIS-Roman 和KS-Roman。 CJK-Roman除下列字符与ASCII码不一致之外,其他都与 ASCII相同。码元值ASCIIGB-RomanCNS-RomanJIS-RomanKS-Roman0x24¥0x5CW0x7E Evaluation only.Evaluation only. Created with Aspose.Slides

10、for .NET 3.5 Client Profile 5.2.0.0.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd.Copyright 2004-2011 Aspose Pty Ltd.2.2 中文信息在计算机中的表示n 为了能使汉字能够在计算机中通行,亚洲国家和地区除了制定CJK-Roman标准外。国际化标准组织() 、国际电气电子工程师协会()以及各汉字使用 国家和地区在计算机技术发展中,也制定了形式多样的汉 字编码字符集。其中最具有代表

11、性的是ISO/IEC 2022标准 。n 该标准定义了位代码和位代码的空间及其代码空间扩充技术。迄今为止,绝大多数计算机系统所采用的字 符集都是以此标准作为基础。Evaluation only.Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd.Copyright 2004-2011 Aspo

12、se Pty Ltd.n从ASCII码的扩展中我们可以得出,如果采用多个位编 码,则除去控制字符区之外,可以获得94*94*94个编 码空间。n若采用双字节的7位代码,则为了保持与ASCII系统的兼容 ,通常采用高位置1的方法来区分汉字代码与ASCII代码。 若采用3字节的7位代码,则可以用一个字节作为汉字代码 ,其余2个7位编码作为汉字代码。n参照ISO/IEC2022标准,中国大陆、中国台湾地区、日本 和韩国等在标准的框架下制定了相应的字符编码标准。Evaluation only.Evaluation only. Created with Aspose.Slides for .NET 3.

13、5 Client Profile 5.2.0.0.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd.Copyright 2004-2011 Aspose Pty Ltd.2.3 汉字代码体系n1.汉字交换码n 汉字交换码是用于信息交换的汉字代码,也称汉字传输码,在GB2312中用双字节表示。它用于汉字信息在计算 机之间的传输。与ASCII码不同,汉字的这种代码表示一般不能直接用于信息处理。Evaluation only.Evaluation onl

14、y. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd.Copyright 2004-2011 Aspose Pty Ltd.n2.汉字处理码n 汉字处理码是用于信息处理的汉子代码,也称汉字内码或汉字机内码。n 汉字的内码在不同的汉字操作系统中的长度可以不同。为了表示汉字的数量,同时考虑到汉字信息的存储和传 输效率等,通常中

15、文操作系统用双字节长度表示汉字的内 码,并把每个字节的高位置1。这样系统中的ASCII码字符 就能够与汉字字符区分。Evaluation only.Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd.Copyright 2004-2011 Aspose Pty Ltd.n3.汉字输入码n 汉字

16、的输入码通常指汉字的键盘输入编码。根据汉字 的属性,汉字的输入键盘码可以分为:音码、形码以及音 形组合码。根据汉字编码说用的字符类别,则可以分别采 用26个英文字母的大键盘编码和采用10个素质的小键盘编 码。汉字的输入码通过键盘转换程序转换成汉字的机内码 。n4.汉字字形码n 汉字的字形码是表示汉字字形的字模数据,通常用点 阵、矢量函数等方式表示。用点阵表示时,汉字字形码就 是这个汉字字形点阵代码。Evaluation only.Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd.Copyright 2004-20

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号