信息的表示－金锄头文库

资源描述

《信息的表示》由会员分享，可在线阅读，更多相关《信息的表示（55页珍藏版）》请在金锄头文库上搜索。

1、Chapter 2数据表示及逻辑基础CS, ZJU9/16/2013Overview 数制数、码编码与文本多媒体数据逻辑基础概述计算就需要数计算机中的数的表示是一个基础性的问题表示各种现实世界对象的 “ 数据 ” ，数的表示也延伸到了数据的表示不同应用需要不同的数据类型，数据类型约定了计算（数据操作）表示实体对象（范围）统一的数据表示方法基本形态是二进制2.2 数制 Number System “ 计数（或记数）体制 ” 多位数中每一位的构成方法以及实现从低位到高位的进位规则，也叫做进制数学家们研究数制的规则和规律计算机科学中将数制规则和规律通过电

2、路实现常用进制二、十、八、十六二进制起源于中国八卦数制常用进制 R进制 R个数码，数码从 0到 R-1 数：每位数码和该位的权系数的乘积权系数也叫做幂次或叫做权重（ Power Weight）逢 R进 1 计数规则十进制 Decimal System 0 9，逢十进一二进制 Binary System 位 (比特， bit）是计算机处理的最小单位 0和 1两个数码，被组合成各种序列以适应计算机的运算和处理的数据类型选择二进制的一个最简单也是最实际的理由是它容易被物理器件实现多项式表示一个二进制数： 101011012= 1 27+0 26+1 25+0 24+1

3、23+1 22+0 21+1 20 = 128+32+8+4+1 = 173八进制 and 十六进制 Octal System 八个数码： 0、 1、 2、 3、 4、 5、 6、 7 8 = 23 一位八进制对应于三位二进制 Hexadecimal System 16个数码： 09 ， A、 B、 C、 D、 E、 F 字节（ Byte， 8个二进制位） = 两位十六进制 16 = 24： 4位二进制和 1位十六进制对应二进制的基本运算二进制加法 0 + 0 = 0 0 + 1 = 1 1 + 0 = 1 1 + 1 = 0 Here Carry 1 二进制乘法 0 0 = 0 0

4、 1 = 0 1 0 = 0 1 1 = 1二进制和十进制转换 1 二进制转换为十进制被转换的二进制数按幂次展开，然后相加 1101.01 2 = 123+122+021+120+02-1+12-2= 8 + 4 + 0 + 1 + 0 + 0.25= 13.25 10 2. 十进制转换为二进制整数部分（除 2取余，低位先产生）小数部分（乘 2取整，高位先产生）十进制整数转换为二进制数173 10 = 10101101 2十进制小数转换为二进制， 0.8125 10 =0.1101 2二进制与八进制转换从小数点出发， 3位二进制对应 1位八进制例： 10110101.0

5、0101 257.0648 = 010 101 111 . 000 110 1002二进制、十六进数转换从小数点出发， 4位二进制对应 1位十六进制例：转换 10110101.00101 成十六进制 10110101.001012 = B5.2816 See Table 2-1常用数制转换方法小结二进制 (八进制、十六进制 )十进制 :求幂相加法十进制二进制 (八进制、十六进制 )整数部分 : 除 2(8、 16)取余 ; 小数部分 : 乘 2(8、 16)取整八进制二进制 : 1位八进制对应 3位二进制十六进制二进制 : 1位十六进制对应 4位二进制十六进制二进制八

6、进制2.4计算机中的数整数的表示正负：符号位， 0表示正数， 1表示负数 +1011 0001011 （前面加 0 调整位数） -1011 1001011（不会混淆时，可以不加 0 ）真值机器数（原码）三种表示方法：原码（ Original Code）反码（ Ones Complement）补码（ Twos Complement）为了数据表示的唯一性和运算方便，采用补码表示原码原码即上述的机器数 n位二进制数，最高位被设置为符号位，其后的 n-1位表示真值。（需要时加 “ 0” 调整位数）原码的特点简单、直观 “ 0” 的表示不唯一： 00

7、（正 0？） 10（负 0？）用原码可以比较方便地进行乘法运算：尾数相乘符号位简单相加法就可以得到乘积的符号反码反码的定义是：一个正数的反码就是它的机器数，负数的反码其最高位（符号位）为 1，其余各位按位求反例如， +1010010 反码为 01010010 - 1010010 反码为 1 0101101 负数的反码和原数相加：结果为所有位都是 1 对 1互补专业术语： Ones Complement 反码本身不用，只是为了定义补码补码补码的定义是：正数的补码等于它的原码，负数的补码等于它的反码加 1（最低位加 1，进位不改变符号位）例如， +1010

8、010 的补码为 01010010- 1010010 的补码为 10101110 补码一个有意思的特性是：补码的补码将还原为原码补码用于减法运算会很方便。 “ 0” 就是 000，而 100表示负值最大的数负数在计算机内表示补码表示法（ 16位字长机器）0000000000000000 = 00000000000000001 = 10111111111111111 = 32767（ 215-1）1000000000000000 = -32768（ -215）1000000000000001 = -327671111111111111111 = -10000000000000000

9、= 00000000000000001 ( 1)+)1111 1111 11111111(-1)0000000000000000 ( 0)(32767+1 = -32768!)实数的浮点数表示实数的表示两种格式：定点数和浮点数计算机中保存数二进制固定长度定点数： 16位或 32位小数点固定在某一个位置定点纯小数、定点纯整数浮点数小数点位置是浮动的浮点数表示实数浮点表示法123. 4567 = 0.1234567 1030. 001234567 = 0.1234567 10-232位小数点后第一位不能是 0：规范化表示，保证唯一性 23位二进制数大约有7位十进制有

10、效数浮点数表示实数浮点数系x = 0.t1t2tn 2e 浮点数表示实数只是近似表示计算会产生误差并传播一方面可以增加字长提高精度，另一方面要研究误差传播规律尾数部分的位数 n（即有效位数）决定了精度阶码部分 e决定了取值范围：如： Xmax = 0.9999999 10+38 , Xmin = 0.1000000 10-38用浮点数表示实数浮点数是有限而稀疏的：0 x x1 xmax浮点数： x=1234567.0 = 0.1234567 107 ，比它大的下一个浮点数是： x1=0.1234568 107 即x1= 12345678.0，所以区间

11、(x-0.5, x+0.5中的所有实数用 x近似表示，区间 (x1-0.5, x1+0.5)中的所有实数用 x1近似表示。超过 xmax太多的实数将会溢出。( ) ( ) 2.5编码和文本数还有另外一种功用：码（ Code）编码的目的是为了便于标记特定的对象设计编码时需要按照一定的规则 “码制（ Code System） ” 重要概念位模式常用编码： ASCII、汉字编码、多媒体数据位模式用于计算的数：用二进制位的多位组合表示定点数、浮点数更多的数据类型，就需要有更多的二进制位的组合规则位模式 bit pattern 用 0和 1组成的二进制位序列及其规则是

12、一种数据表示方法要由计算机程序去理解它们位模式要求：用户、程序设计者按某种规则形成、存储和处理数据位模式的二进制位序列长度取决于被编码对象的数量文本和文档文本（ Text）编码来表示文本中的每一个符号包括字母、标点，都以一个唯一的二进制位序列表示在计算机中，文本就是位模式的二进制数据长串基础的文本编码就是 ASCII American Standard Code for Information Interchange 基于 English 文本编码是计算机进行数据交换的基础ASCII码 ANSI制定，后为 ISO 646 适用于英文，两种形式： 7位码和 8位码 7位二进制

13、ASCII码单字节字符编码方案，基本的文本数据 8位码是扩展 ASCII码， See Appendix AUnicode编码通用多文种字符集表示几乎世界上所有书写语言的字符编码标准统一码、单一码、万国码可支持超过百万个字符的编码 Unicode编码国际标准 ISO 10646 ISO采用的是 32位模式用于世界范围各种语言文字的文本形式的字符集，也收集了汉字汉字编码汉字编码的目的是为了计算机能够处理、显示、打印、交换汉字字符国家汉字编码标准 GB2312-1980 简化汉字 6763个， 7445个字符港澳台地区使用繁体汉字 BIG5码 1995年的 GBK扩展汉字编码标准

14、 GB2312-1980的扩展收录了 2.1万多个汉字 GBK支持 ISO 10646中的全部中、日、韩汉字 2001年 GB18030GBK 的升级 160万码位，目前汉字约为 2.6万个2.6多媒体数据多媒体文本，图形、音频、视频等多种数据表现形式，并使之在逻辑上建立联系今天计算机和网络都支持多媒体数据处理相比文本图形和图像图形（ Graphics）几何线条、几何符号等形式表示物体的轮廓在数据表达上图形和图像也被认为是同类例如， Windows的 “ 画笔 ” 程序，既可以画几何图形，也可以对图形着色使之成为图像（Picture， Image）两种技术：位图和矢量图位图技术微软公司提出的又称光栅图（ Raster Graphics）使用像素（ Pixel）阵列，每一个像素是一个点（Dot），点数据的大小取决于分辨率位模式有 1、 4、 8、 16、 24及 32位等灰度图像每一个像素需要更多的二进制位彩色图形、图像 R

展开阅读全文

信息的表示

最新文档