单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第,3,章 信息编码与数据表示,第,3,章 信息编码与数据表示,3.1,数值数据的表示,3.2,非数值数据的表示,3.3,校验码,本章小结,作业,10/4/2024,1,3.2,非数值数据的表示,非数值数据:文字和符号(,字符,)、图像、声音等,非数值数据的表示:对其进行二进制编码,一、字符编码,二、汉字编码,10/4/2024,2,一、字符编码,字符的表示:采用字符编码,即用规定的二进制数表示文字和符号的方法ASCII,码:,美国标准信息交换码,为国际标准,在全世界通用常用的,7,位,ASCII,码,的每个字符都由,7,个二进制位,b6,b0,表示,有,128,个编码,最多可表示,128,种字符;其中包括:,10,个数字,0,9,:,30H,39H,,顺序排列,26,个小写字母,a,z,:,61H,7AH,,顺序排列,26,个大写字母,A,Z,:,41H,5AH,,顺序排列,各种运算符号和标点符号等10/4/2024,3,ASCII,码编码表,000,001,010,011,100,101,110,111,0000,NUL,DLE,SP,0,P,p,0001,SOH,DC1,!,1,A,Q,a,q,0010,STX,DC2,“,2,B,R,b,r,0011,ETX,DC3,#,3,C,S,c,s,0100,EOT,DC4,¥,4,D,T,d,t,0101,ENQ,NAK,%,5,E,U,e,u,0110,ACK,SYN,&,6,F,V,f,v,0111,BEL,ETB,7,G,W,g,w,1000,BS,CAN,(,8,H,X,h,x,1001,HT,EM,),9,I,Y,i,y,1010,LF,SUB,*,:,J,Z,j,z,1011,VT,ESC,+,;,K,k,1100,FF,FS,,,L,、,l,|,1101,CR,GS,-,=,M,m,1110,SO,RS,.,N,n,1111,SI,US,/,?,O,_,o,DEL,10/4/2024,4,ASCII,码分类,95,个可打印或显示的字符:,称为图形字符,有确定的结构形状,可在打印机和显示器等输出设备上输出;而且这些字符均可在计算机键盘上找到相应的键,按键后就可以将相应字符的二进制编码送入计算机内。
33,个控制字符:,不可打印或显示,分成,5,类:,10,个传输类控制字符:用于数据传输控制;,6,个格式类控制字符,用于控制数据的位置;,4,个设备类控制字符,用于控制辅助设备;,4,个信息分隔类控制字符,用于分隔或限定数据,9,个其他控制字符、空格字符和删除字符10/4/2024,5,二、汉字编码,对于汉字,计算机的处理技术必须解决三个问题:汉字输入、汉字储存与交换、汉字输出,它们分别对应着汉字输入码、内码、字模码的概念因此,汉字编码系统存在以下三种编码:,1,、汉字输入码,2,、汉字内码,3,、汉字字模码,10/4/2024,6,1,、汉字输入码,汉字输入码也称,外码,,是为了将汉字输入计算机而编制的代码,,是代表某一汉字的一串键盘符号,汉字输入码种类:,数字编码:如区位码、国标码、电报码等拼音编码:如全拼码、双拼码、简拼码等字形编码:如王码五笔、郑码、大众码等音形编码:如表形码、钱码、智能,ABC,等10/4/2024,7,1,、汉字输入码,两种典型的数字编码:,区位码:,是将国家标准局公布的,6763,个两级汉字分为,94,个区,每个区分,94,位,,实际上把汉字表示成二维数组,,每个汉字在数组中的下标就是区位码,。
例如“中”字位于,54,区,48,位,“中”字的区位码即为“,5448”,国标码:,将,区位码加,2020H,,占用两个字节例如“中”字的国标码为区位码,5448,的区码和位码转化为,16,进制,为,3630H,,再加,2020H,得国标码,5650H,10/4/2024,8,2,、汉字机内码,汉字内码是用于汉字信息的存储、交换、检索等操作的机内代码,,一般采用,两个字节,表示汉字可以通过不同的输入法输入,但其内码在计算机中是唯一的英文字符的机内代码是七位的,ASCII,码,当用一个字节表示时,最高位为“,0”,为了与英文字符能相互区别,,汉字机内代码中两个字节的最高位均规定为“,1,”,机内码等于汉字国标码加上,8080H,例如,“,中,”,字的机内码为,D6D0H,10/4/2024,9,3,、汉字字模码,汉字字模码又称,汉字字形码,,它是将汉字字形经过点阵数字化后形成的一串二进制数,用于汉字的显示和打印根据汉字输出的要求不同,点阵有以下几种:,简易型汉字:,16,16,,,32,字节,/,汉字,普通型汉字:,24,24,,,72,字节,/,汉字,提高型汉字:,32,32,,,128,字节,/,汉字。
汉字字库:,将所有汉字的字模点阵代码按内码顺序集中起来,构成了汉字库10/4/2024,10,汉字输入码,汉字交换码(国标码),汉字输入法程序,汉字字模码,字形检索程序,汉字显示,汉字打印,汉字内码,8080H,10/4/2024,11,3.3,校验码,一、校验码概述,二、奇偶校验码,三、海明校验码,四、,CRC,校验码,10/4/2024,12,一、校验码概述,1,、校验码定义,:是一种具有发现某些错误或自动改正错误能力的一种数据编码方法2,、校验码目的:,用于,检查或纠正,在存取、读写和传送数据的过程中可能出现的,错误,3,、校验码的基本思想:,“冗余校验”,即通过在有效信息代码的基础上,添加一些冗余位来构成整个校验码4,、校验码的构成:,有效信息校验位(由有效信息产生的冗余位),10/4/2024,13,一、校验码概述,5,、校验过程:,有效,信息,校验码,编码器,校,验,码,校验位,校,验,码,发送,/,写,/,存,接收,/,读,/,取,有,效,信,息,校,验,位,有,效,信,息,校,验,位,校验码,译码器,正确,错误,输出,10/4/2024,14,一、校验码概述,6,、校验码原理:,通过判断代码的合法性来检错的。
只有当合法码之间的码距,d,2,时,校验码才具有,检错能力,,当码距,d,3,时,校验码才具有,纠错能力,码距:,一种码制的码距是指该码制中所有代码之间的最小,距离,两个代码之间的距离,:在一种编码中,在任何两个代码之间逐位比较,对应位值不同的个数10/4/2024,15,一、校验码概述,7,、常见校验码:,奇偶校验码:,码距,d=2,,检错码,,能检验奇数位错误,;通常用于磁带或者串行通信中海明校验码:,码距,d=3,,纠错码,,能纠正,1,位或多位错误,;通常用于磁盘冗余阵列中CRC,校验码:,码距,d=3,,纠错码,,能纠正,1,位错误,;通常用于磁盘或数据块的校验10/4/2024,16,二、奇偶校验码,校验方法:,在有效信息位的前面或者后面或者中间添加一位奇(偶)校验位就组成了奇(偶)校验码奇校验码:,奇,校验位,的取值应该使整个奇校验码中“,1”,的个数为奇数偶校验码:,偶,校验位,的取值应该使整个偶校验码中“,1”,的个数为偶数例:分别写出,10101011,的奇偶校验码,假设校验位位于末尾奇校验码:,偶校验码:,10101011,0,10101011,1,10/4/2024,17,本章小结,数制:两大要素:基数,R,与各位的权,W,。
计算机中的信息均由二进制来表示,,R=2,,,W=2,i,BCD,码:用于表示十进制数值的二进制编码被称为,BCD,码,一般用,4,位二进制编码来表示一个十进制数字定点机器数:分为定点小数和定点整数两种有四种表示形式:原码、反码、补码和移码浮点机器数:小数点的位置随阶码数值而变化由阶码,E,和尾数,M,两部分构成,阶码是定点整数,尾数是定点小数;阶码,E,(即指数)的底,一般隐含为,2,IEEE754,浮点数标准10/4/2024,18,本章小结,计算机中的非数值数据的表示:,字符数据通常采用,7,位的,ASCII,码来表示;,汉字的表示:,输入编码用于使用西文标准键盘输入汉字,汉字的机内码则用于汉字的存储、检索和处理,汉字的字模码则用于汉字的显示和打印输出校验码:检错和纠错奇偶校验码是最简单的一种检错码,它可以检查出一位或奇数位错误本章重点为定点机器数和浮点机器数的表示方法,10/4/2024,19,作业,P61,:,7,补充作业:,1,、在,7,位的,ASCII,码的最高位前面添加一位奇(偶)校验位后,即可构成,8,位的,ASCII,码的奇(偶)校验码假设字符“,A”,的这样的奇(偶)校验码为,41H,,则问:,(,1,)它是奇校验码,还是偶校验码?,(,2,)字符“,C”,的这样的奇(偶)校验码为多少?,10/4/2024,20,The End!,10/4/2024,21,。