信息表示与存储程序原理.ppt

资源描述

《信息表示与存储程序原理.ppt》由会员分享，可在线阅读，更多相关《信息表示与存储程序原理.ppt（29页珍藏版）》请在金锄头文库上搜索。

1、主要内容复习数值在计算中的表达方式熟悉二进制形式(有符号与无符号(补码)其他信息在计算机中的存储和表达方式计算机中的信息表达自然界的信息形式多种多样，在计算机中都是以二值形式来表达。输入过程实现信息表达方式的转换（编码）。相关术语：位（bit)计算机中存储信息的最小单位。0，1 字节（B,byte) 1字节(byte)=8位（bit) 1K(kilo)B= =1024B 千字节1M(mega)B= = 兆字节1G(giga)B= = 吉字节字符0（48）1 1数制转换数制转换十进制：9001=二进制： 0, 1, 10, 11, 100, 101, 110, 111, 1000, 1001

2、, 1010, 1011, 1100, 1101, 1110, 1111八进制：十六进制： (A=10, B=11, C=12,D=13,E=14,F=15)数码转换：二、八、十六十进制：按上页方法展开即可十二、八、十六进制：例：将十进制435转换为二进制数 2 435 2 217 （1 2 108 （1 2 54 （0 2 27 （0 2 13 （1 2 6 （1 2 3 （0 2 1 （1 2 0 （1 435=二、八、十六进制之间八进制：三位一组十六进制：四位一组例：二进制数的四则运算例：0+0=0 0+1=1 1+0=1 1+1=10 用补码能表示的数据范围是(4位) 数原码反码

3、(值位求反)补码(值位求反加1)0 00001000120010同原码6011070111-1100111101111-2101011011110-3101111001101-6111010011010-7111110001001-8无无1000无符号数：015有符号：-87 2 2 数的表示范围和精度数的表示范围和精度无符号整数无符号整数例：数据宽度是例：数据宽度是1616位，可表示的数据范围是：位，可表示的数据范围是：15 14 13 2 1 0 15 14 13 2 1 0 1 0 0 1 0 0 1 1 0 0 1 1 0 0 有符号整数有符号整数 1 1、有三种表示方法：原码、反码、

4、补码。、有三种表示方法：原码、反码、补码。最高位是符号位，最高位是符号位，0 0表示正数，表示正数，1 1表示负数。表示负数。 2 2、计算机中、计算机中对负数对负数采用补码表示。用补码表示的数做加减采用补码表示。用补码表示的数做加减法可以不考虑符号位，即符号位可参与运算。法可以不考虑符号位，即符号位可参与运算。例：数据宽度是例：数据宽度是4 4位，求各数的二进制位，求各数的二进制原、反、补码（见下页表）原、反、补码（见下页表）并用补码计算：并用补码计算： 1-2= -1 3-2=1 1-2= -1 3-2=1 3+6=93+6=9（溢出）（溢出） 0001 0001 0011 00110

5、011 0011 + +） 1110 1110 + +）1110 +1110 +） 01100110 1111 1111 1 10001 10010001 1001 进位进位丢掉丢掉同符号数相加，符号变了同符号数相加，符号变了我们前面介绍了计算机中数的二进制表示及补码，下面讨论数的表示方法和范围。同学们还应熟悉数的八进制和十六进制表示。例：用16位表示的数1514131232 108101100011100 00 0 1(1011000111000001)2=？有符号数： -无符号数 0-十六进制数与二进制数的对应关系十六二0000 0001 0010 0011 0100 0101 01

6、10 0111 1000 1001 1010 1011 1100 1101 1110 1111 0 1 2 3 4 5 6 7 8 9 A B C D E F如0xFF=？，0x00=？（在C语言的位运算中会用到）符符号号表现表现形式形式数据数据长度长度数值范围数值范围带带符符号号int32-21474836482147483647short16-3276832767long32-21474836482147483647无无符符号号unsigned int3204294967295unsigned short16065535unsigned long3204294967295小数的表示方法小数

7、的表示方法计算机中通常采用浮点方式表示小数计算机中通常采用浮点方式表示小数一个数一个数 N N 用浮点形式表示可以写成：用浮点形式表示可以写成： N=MN=M2 2E E E E表示表示2 2的幂，称为数的幂，称为数N N的阶码。阶码确定了数的阶码。阶码确定了数N N的小数点的位置，其位数反映了该浮点数所表示的小数点的位置，其位数反映了该浮点数所表示的数的范围。的数的范围。M M表示数表示数N N的全部有效数字，称为数的全部有效数字，称为数N N的尾数。的尾数。其位数反映了数据的精度。其位数反映了数据的精度。实数（小数）的表示实数（小数）的表示采用科学计数法采用科学计数法 8 24 指数符

8、号位指数符号位尾数符号位尾数符号位 4 4字节表示一实数：字节表示一实数：阶码范围阶码范围-128-128127127，数的范围，数的范围 23 23位大约表示位大约表示7 7位十进制数，精度位十进制数，精度7 7位。位。采用双精度一实数：采用双精度一实数：范围范围，精度，精度16161717位位例例 0 000,0110 ,1 010,0000,0000,0000,0000,0000 表示表示指数有效数位指数有效数位尾数有效数位尾数有效数位练习将下列十进制数转换为将下列十进制数转换为16位二进制补码及十六进制位二进制补码及十六进制形式。形式。(32)10=?(32)10 = (0

9、000 0000 0010 0000)2=(0020)16(-32)10=?(-32)10= (1111 1111 1110 0000)2=(FFE0)16(-1)10=?(-1)10 = (1111 1111 1111 1111)2=(FFFF)16(65535)10在16位二进制数代表？位二进制数代表？(65535)10=(1111 1111 1111 1111)2=(FFFF)16无符号 3 字符及其编码字符及其编码当我们从键盘上输入十进制数或字符时，当我们从键盘上输入十进制数或字符时，都被计算机内完成输入工作的软件翻译成内部都被计算机内完成输入工作的软件翻译成内部的二进制形式。的二进

10、制形式。编码方法编码方法：确定字符集，按顺序排队，给每个：确定字符集，按顺序排队，给每个符号确定一个编码。编码只起区分作用，数值符号确定一个编码。编码只起区分作用，数值大小无所谓。大小无所谓。通常采用通常采用ASCIIASCII编码。编码。(American Standard Code for Information Interchang 美国标准信息代码）美国标准信息代码）0-1270-127或或EBCDIC(Extented Binary Code Decimal Interchange Code)码（码（0 0255255）空格退格486597用一个字节表示一个字符。用一个字节表示一个字

11、符。以上是以上是ASCIIASCII码（码（128128个），扩展的个），扩展的ASCIIASCII首位为首位为1 1ASCIIASCII码表码表4 4、中文信息的编码和输入方法、中文信息的编码和输入方法汉字在机器内部是如何表示的？汉字在机器内部是如何表示的？国标码国标码。GB基本字符集共基本字符集共6763个，一级个，一级3755个，二级个，二级3008个。个。国家标准国家标准“信息交换用汉字编码字符集信息交换用汉字编码字符集基本集基本集”GB231280区位码：共设区位码：共设94个区，每区个区，每区94个字符。个字符。 115区表示西文字母、数字、图形符号区表示西文字母、数字、图形符号

12、 16-87区编排汉字区编排汉字 8894用户自定义用户自定义内码：用双字节内码：用双字节16位表示一个汉字（汉字的机器内码）可表示位表示一个汉字（汉字的机器内码）可表示65536个，使用每个字节的后个，使用每个字节的后7位（位（33126共共94个）表示。个）表示。区位码与内码的关系：第区位码与内码的关系：第1区第区第1位在计算机中用位在计算机中用A1A1H表示表示例：爱的区位码为例：爱的区位码为1614D，求内码，求内码 (汉字每字节高位均为汉字每字节高位均为1) 区区（第一字节）（第一字节）位位（第二字节）（第二字节） 10H 10H 0EH 0EH + A0H 20H + A0H

13、 20H - 30H (0) - 2FH(/) 302FH国标国标 B0H（10110000） AEH（10101110） B0AEH内码内码国家标准总局于一九八国家标准总局于一九八年发布的国家标准信息交换用汉字编码字符集，即年发布的国家标准信息交换用汉字编码字符集，即常称的国标码字符集（常称的国标码字符集（GBGB），共有），共有67636763个汉字，包括常用汉字有四千多，次常用个汉字，包括常用汉字有四千多，次常用汉字约三千左右。现在常用的汉字输入法一般只支持这一字库量。汉字数量近十汉字约三千左右。现在常用的汉字输入法一般只支持这一字库量。汉字数量近十万，常用的汉字字典、词典收集的汉字一般

14、在一万二千左右，字典、词典上大量万，常用的汉字字典、词典收集的汉字一般在一万二千左右，字典、词典上大量的汉字特别是人名、地名用字没能包括在国标码之中，如的汉字特别是人名、地名用字没能包括在国标码之中，如“蹓跶蹓跶”这两个字、啰这两个字、啰嗦的嗦的“啰啰”字、瞭望的字、瞭望的“瞭瞭”字、朱镕基总理的字、朱镕基总理的“镕镕”字、只支持国标码的输入字、只支持国标码的输入法满足不了日常输入需要。法满足不了日常输入需要。一九九一九九年中国、日本、韩国共同制定的统一东亚表意文字字符集，即常称年中国、日本、韩国共同制定的统一东亚表意文字字符集，即常称的的国标扩展码字符集（国标扩展码字符集（GBKGBK），

15、共有，共有2090220902个汉字，包括现代汉语通用字表和邮电个汉字，包括现代汉语通用字表和邮电通信字符符集的字符及其繁体、台湾地区的通信字符符集的字符及其繁体、台湾地区的通用汉字标准交换码通用汉字标准交换码所含字符、所含字符、一些香港用字及日文、朝鲜文用汉字，一些香港用字及日文、朝鲜文用汉字，原来的国标码的编码位置不变。原来的国标码的编码位置不变。考虑近一考虑近一半汉字有简繁体两种字体形式这一因素，扩展码实际拥有的汉字量为一万三千左半汉字有简繁体两种字体形式这一因素，扩展码实际拥有的汉字量为一万三千左右，常用字、词典收集的汉字差不多全部包含在其中。简体中文右，常用字、词典收集的汉字差不多全

16、部包含在其中。简体中文WIN 95WIN 95及其以后及其以后的版本符合的版本符合GBKGBK标准，目前的各种输入法也应做到支持标准，目前的各种输入法也应做到支持GBKGBK标准。标准。大量的汉字存在于古籍之中，大量的汉字存在于古籍之中，数量达九万之多，数量达九万之多，如从事古文输入输出，如从事古文输入输出，GBKGBK仍不能满足要求，所以用于特殊专业的输入法，还应扩大所能支持的字库规模。仍不能满足要求，所以用于特殊专业的输入法，还应扩大所能支持的字库规模。 GBKGBK编码范围是编码范围是8140HFEFEH8140HFEFEH。BIG5BIG5（大五码）台湾常用的信息交换码编码范围是

17、（大五码）台湾常用的信息交换码编码范围是A140HFEFEH A140HFEFEH ，有，有1306013060汉字。汉字。Unicode统一的字符编码标准统一的字符编码标准, 是一种可伸缩的编码。是一种可伸缩的编码。允许用单字节表示常用的允许用单字节表示常用的ASCII符号，采用符号，采用双字节对汉字符进行编码等。双字节对汉字符进行编码等。由由APPLE和和XEROX在在1988年建立，目前年建立，目前Apple、IBM 、Microsoft、Novell、Sun、Lotus等负责。其中有拉丁字母、俄罗斯、日语、等负责。其中有拉丁字母、俄罗斯、日语、汉字等的编码。汉字等的编码。汉字的输入方

18、法有很多，如全拼输入法、五笔汉字的输入方法有很多，如全拼输入法、五笔字型法、智能字型法、智能ABCABC等数以千计。但常用的有几十等数以千计。但常用的有几十种，同学们至少应掌握种，同学们至少应掌握1 12 2种。这些输入方案种。这些输入方案大都以汉字的拼音及字型有关。如大都以汉字的拼音及字型有关。如 “种种” 全拼全拼为为zhong,zhong,双拼为双拼为as,ABCas,ABC为为zhong, zhong, “缠缠”的五笔的五笔为丝广日土为丝广日土xyjfxyjf例例: :人输入人输入tete键盘转换键盘转换tete的编码的编码查找汉字库查找汉字库, ,找到输入码对应的汉字找到输入码对应的

19、汉字显示显示1 1 特特 2 2 忑忑- -选择选择1 1得到得到”特特”的国标码的国标码得到内码得到内码前面讲的是如何解决输入及内部表示，汉字在输出时需解决内码到字型的变换一个汉字要32字节表示对一种字型，大字体与小字体需要不同的分辨率，否则显得粗糙，1616字库需270KB，64 64字库需4MB，1024 1024字库需百兆汉字有很多字型，字库需要的存储量过大用用矢量的矢量的方法表示汉字，实际上是描述汉字方法表示汉字，实际上是描述汉字的轮廓特征。对于某种字型而言，一个汉字的轮廓特征。对于某种字型而言，一个汉字的矢量描述大约需要一百到几百字节，一种的矢量描述大约需要一百到几百字节，一种字

20、体的国标汉字库大约有字体的国标汉字库大约有1兆到几兆字节大小兆到几兆字节大小.它描述的是汉字字型的有关信息，与汉字实际它描述的是汉字字型的有关信息，与汉字实际输出大小无关，任何时候都能根据需要产生高输出大小无关，任何时候都能根据需要产生高质量的汉字输出。不过字型恢复需花费时间。质量的汉字输出。不过字型恢复需花费时间。例如方正例如方正汉字激光照排系统。 5 5、图形的数字化编码、图形的数字化编码 480 图的图的“点阵表示点阵表示”：个像元（像素）个像元（像素）图象等非字符信息也是通图象等非字符信息也是通过数值化的方法在计算机过数值化的方法在计算机中表示的中表示的。像元像元640 5 5、图形

21、的数字化编码图形的数字化编码一副图所需的存储空间：一副图所需的存储空间：纯黑、纯白图纯黑、纯白图需需字节字节每个像元使用每个像元使用256256个灰度表示需个灰度表示需字节字节=300KB=300KB每个像元使用真彩色表示，红绿蓝各每个像元使用真彩色表示，红绿蓝各256256色需色需字节字节=0.9M=0.9M1010分钟的连续电视图象需分钟的连续电视图象需 =13800MB=13800MB图象的压缩和恢复问题，不同方法，图形数据的格式图象的压缩和恢复问题，不同方法，图形数据的格式各不相同各不相同.bmp .jpg .gif .bmp .jpg .gif 等，动画等，动画 .gif

22、.avi .gif .avi 。声音声音 mp3mp3编码编码例例画图画图-保存可看几种格式保存可看几种格式典型的图形典型的图形/ /图象处理软件有图象处理软件有Paint Brush, Paint Brush, PhotoshopPhotoshop等。等。机器中自带画图机器中自带画图例例画图画图-保存可看几种格式保存可看几种格式指令、程序和存储程序原理指令、程序和存储程序原理1、指令分类与编码指令分类与编码操作码（操作码（OPOP）地址码（地址码（D D）指令是一系列二进制代码，由指令是一系列二进制代码，由操作码操作码和和地址码地址码组成组成本条指令要求计算机完成的操作本条指令要

23、求计算机完成的操作如加、减、移位、传送等如加、减、移位、传送等参加本次运算的操作数参加本次运算的操作数和运算结果所在地址，如和运算结果所在地址，如通用寄存器、内存地址等。通用寄存器、内存地址等。存储器访问类（内存）存储器访问类（内存）算术运算和逻辑运算算术运算和逻辑运算条件判断和分支条件判断和分支输入、输出：启动外设输入、输出：启动外设控制和系统指令控制和系统指令指令分类指令分类一个一个CPUCPU所能执行的所有指令、指令的所能执行的所有指令、指令的编码方式、参数个数和意义等的整体构编码方式、参数个数和意义等的整体构成成CPUCPU的的“指令系统指令系统”。2、程序和计算机的基本工作循环程序

24、和计算机的基本工作循环由操作系统将第一条指令地址放入程序计数器由操作系统将第一条指令地址放入程序计数器控制器由控制器由“程程序计数器序计数器”取出指令地址取出指令地址取指令取指令执行指令执行指令读内存，将指令送入读内存，将指令送入“指令寄存器指令寄存器” 解释指令、可能的内存读取解释指令、可能的内存读取加加1 1，更新程序计数器内容，变为下一条指令地址，更新程序计数器内容，变为下一条指令地址返回返回( (扫描中断扫描中断) ) 指令通过数据总线进入指令通过数据总线进入CPUCPU 美国数学家冯美国数学家冯诺依曼诺依曼控制器是实现此基本循环的主体3、分支指令和程序流程控制分支指令

25、和程序流程控制开始开始累加单元放初值累加单元放初值0 计数器单元放初值计数器单元放初值1 求出计数器单元值的平方求出计数器单元值的平方将这个值加到累加单元的值上将这个值加到累加单元的值上计数器单元的值加计数器单元的值加1 计数单元值计数单元值是是 =10? 否否从累加单元取出计算结果从累加单元取出计算结果结束结束分支指令本分支指令本身指定了下身指定了下一条指令的一条指令的地址地址4 4、中断中断(Interrupt)(Interrupt) 扫描中断扫描中断中断举例：中断举例：无法预知的事件，如：无法预知的事件，如：响应中断响应中断硬件故障、软件出错，操作硬件故障、软件出错

26、，操作人员的干预人员的干预关闭中断关闭中断保护断点保护断点找到中断程序的入口找到中断程序的入口保护保护CPUCPU 执行中断执行中断处理程序处理程序恢复恢复CPUCPU现场现场开中断开中断返回主程序返回主程序事件发生时能向事件发生时能向CPUCPU发发出请求出请求“中断请求中断请求”中断系统是软、硬件的中断系统是软、硬件的结合，其中软件系统是结合，其中软件系统是操作系统的一个基本组操作系统的一个基本组成部分成部分中断向中断向量表查量表查禁止其他中断请求5、CPU的兼容性问题指令在计算机中也采用二进制编码方式，指令在计算机中也采用二进制编码方式，每种特定的每种特定的CPUCPU有自己的指令集合，每条有自己的指令集合，每条指令有特定的编码方式。指令有特定的编码方式。IntelIntel公司的公司的X86X86系列，系列，IBMIBM公司的公司的POWERPOWER系列。系列。

展开阅读全文

信息表示与存储程序原理.ppt

最新文档