信息的表示

上传人:飞*** 文档编号:4150694 上传时间:2017-10-23 格式:PPT 页数:55 大小:784.98KB
返回 下载 相关 举报
信息的表示_第1页
第1页 / 共55页
信息的表示_第2页
第2页 / 共55页
信息的表示_第3页
第3页 / 共55页
信息的表示_第4页
第4页 / 共55页
信息的表示_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《信息的表示》由会员分享,可在线阅读,更多相关《信息的表示(55页珍藏版)》请在金锄头文库上搜索。

1、Chapter 2数据表示及逻辑基础CS, ZJU9/16/2013Overview 数制 数、码 编码与文本 多媒体数据 逻辑基础概述 计算就需要数 计算机中的数的表示是一个基础性的问题 表示各种现实世界对象的 “ 数据 ” , 数的表示也延伸到了数据的表示 不同应用需要不同的 数据类型 ,数据类型约定了 计算( 数据操作 ) 表示实体对象( 范围 ) 统一的数据表示方法 基本形态是 二进制2.2 数制 Number System “ 计数(或记数)体制 ” 多位数中每一位的构成方法以及实现从低位到高位的进位规则,也叫做进制 数学家们研究数制的规则和规律 计算机科学中 将数制规则和规律通过电

2、路实现 常用进制 二、十、八、十六二进制起源于中国 八卦数制 常用 进 制 R进制 R个数码,数码从 0到 R-1 数 :每位 数码和该位的权系数的乘积 权系数也叫做幂次或叫做权重( Power Weight) 逢 R进 1 计数规则 十进制 Decimal System 0 9,逢十进一二进制 Binary System 位 (比特, bit)是计算机处理的最小单位 0和 1两个数码,被组合成各种序列以适应计算机的运算和处理的数据类型 选择二进制的一个最简单也是最实际的理由是它 容易被物理器件实现 多项式表示一个二进制数 : 101011012= 1 27+0 26+1 25+0 24+1

3、23+1 22+0 21+1 20 = 128+32+8+4+1 = 173八进制 and 十六进制 Octal System 八个数码 : 0、 1、 2、 3、 4、 5、 6、 7 8 = 23 一位八进制对应于三位二进制 Hexadecimal System 16个数码 : 09 , A、 B、 C、 D、 E、 F 字节( Byte, 8个二进制位) = 两位十六进制 16 = 24: 4位二进制和 1位十六进制对应二 进 制的基本运算 二进制加法 0 + 0 = 0 0 + 1 = 1 1 + 0 = 1 1 + 1 = 0 Here Carry 1 二进制乘法 0 0 = 0 0

4、 1 = 0 1 0 = 0 1 1 = 1二进制和十进制转换 1 二进制转换为十进制 被转换的二进制数 按幂次展开 ,然后相加 1101.01 2 = 123+122+021+120+02-1+12-2= 8 + 4 + 0 + 1 + 0 + 0.25= 13.25 10 2. 十进制转换为二进制 整数部分( 除 2取余,低位先产生 ) 小数部分( 乘 2取整,高位先产生 )十进制整数转换为二进制数173 10 = 10101101 2十进制小数转换为二进制, 0.8125 10 =0.1101 2二进制与八进制转换 从小数点出发 , 3位二进制对应 1位八进制 例: 10110101.0

5、0101 257.0648 = 010 101 111 . 000 110 1002二进制、十六进数转换 从小数点出发 , 4位二进制对应 1位十六进制 例:转换 10110101.00101 成十六进制 10110101.001012 = B5.2816 See Table 2-1常用数制转换方法小结 二进制 (八进制、十六进制 )十进制 :求幂相加法 十进制 二进制 (八进制、十六进制 )整数部分 : 除 2(8、 16)取余 ; 小数部分 : 乘 2(8、 16)取整 八进制 二进制 : 1位八进制对应 3位二进制 十六进制 二进制 : 1位十六进制对应 4位二进制 十六进制 二进制 八

6、 进制2.4计算机中的数 整数 的表示 正负:符号位, 0表示正数, 1表示负数 +1011 0001011 (前面加 0 调整位数) -1011 1001011(不会混淆时,可以不加 0 ) 真值 机器数(原码) 三种表示方法: 原码 ( Original Code) 反码 ( Ones Complement) 补码 ( Twos Complement) 为了数据表示的 唯一性 和 运算方便 ,采用 补码 表示原码 原码 即上述的机器数 n位二进制数,最高位被设置为符号位,其后的 n-1位表示真值。(需要时加 “ 0” 调整位数) 原码的特点 简单、直观 “ 0” 的表示 不唯一 : 00

7、(正 0?) 10(负 0?) 用原码可以比较方便地进行 乘法 运算: 尾数相乘 符号位简单相加 法就可以得到乘积的符号反码 反码 的定义是:一个正数的反码就是它的机器数,负数的反码其最高位(符号位)为 1,其余各位按位求反 例如, +1010010 反码为 01010010 - 1010010 反码为 1 0101101 负数的 反码和原数相加:结果为所有位都是 1 对 1互补 专业术语: Ones Complement 反码本身不用,只是 为了定义补码补码 补码 的定义是: 正数 的补码等于它的 原码 , 负数的补码等于它的 反码加 1(最低位加 1,进位不改变符号位) 例如, +1010

8、010 的补码为 01010010- 1010010 的补码为 10101110 补码一个有意思的特性是:补码的补码将还原为原码 补码用于 减法运算 会很方便。 “ 0” 就是 000,而 100表示 负值最大 的数负数在计算机内表示 补码表示法( 16位字长机器)0000000000000000 = 00000000000000001 = 10111111111111111 = 32767( 215-1)1000000000000000 = -32768( -215)1000000000000001 = -327671111111111111111 = -10000000000000000

9、= 00000000000000001 ( 1)+)1111 1111 11111111(-1)0000000000000000 ( 0)(32767+1 = -32768!)实数的浮点数表示 实数的表示 两种格式: 定点数 和 浮点数 计算机中保存数 二进制 固定长度 定点数: 16位或 32位 小数点固定在某一个位置 定点纯小数、定点纯整数 浮点数 小数点位置是浮动的浮点数表示实数 浮点表示法123. 4567 = 0.1234567 1030. 001234567 = 0.1234567 10-232位小数点后第一位不能是 0:规范化表示,保证 唯一性 23位二进制数大约有7位十进制 有

10、效数浮点数表示实数 浮点数系x = 0.t1t2tn 2e 浮点数表示实数只是 近似 表示 计算 会产生误差 并 传播 一方面可以增加字长提高精度,另一方面要研究 误差传播规律 尾数部分的位数 n(即 有效位数 )决定了 精度 阶码部分 e决定了 取值范围 :如: Xmax = 0.9999999 10+38 , Xmin = 0.1000000 10-38用浮点数表示实数 浮点数是 有限 而 稀疏 的:0 x x1 xmax浮点数: x=1234567.0 = 0.1234567 107 ,比它大的下一个浮点数是: x1=0.1234568 107 即x1= 12345678.0,所以区间

11、(x-0.5, x+0.5中的所有实数用 x近似表示,区间 (x1-0.5, x1+0.5)中的所有实数用 x1近似表示。 超过 xmax太多的实数将会 溢出 。( ) ( ) 2.5编码和文本 数还有另外一种功用: 码 ( Code) 编码的目的是为了便于标记特定的对象 设计编码时需要按照一定的规则 “码制 ( Code System) ” 重要概念 位模式 常用编码: ASCII、 汉字编码 、 多媒体数据位模式 用于计算的数:用二进制位的多位组合表示定点数、浮点数 更多的数据类型,就需要有更多的二进制位的组合规则 位模式 bit pattern 用 0和 1组成的二进制位序列及其规则 是

12、一种数据表示方法 要由计算机程序去理解它们 位模式要求: 用户、程序设计者按某种规则形成、存储和处理数据 位模式的二进制位序列长度取决于被编码对象的数量文本和文档 文本( Text) 编码来表示 文本中的每一个符号包括字母、标点,都以一个唯一的二进制位序列表示 在计算机中,文本就是位模式的二进制数据长串 基础的文本编码就是 ASCII American Standard Code for Information Interchange 基于 English 文本编码是计算机进行数据交换的基础ASCII码 ANSI制定,后为 ISO 646 适用于英文,两种形式: 7位码和 8位码 7位二进制

13、ASCII码 单字节字符编码方案,基本的文本数据 8位码是扩展 ASCII码, See Appendix AUnicode编码 通用多文种字符集 表示几乎世界上所有书写语言的字符编码标准 统一码、单一码、万国码 可支持超过百万个字符的编码 Unicode编码 国际标准 ISO 10646 ISO采用的是 32位模式 用于世界范围各种语言文字的文本形式的字符集,也收集了汉字汉字编码 汉字编码的目的是为了计算机能够处理、显示、打印、交换汉字字符 国家汉字编码标准 GB2312-1980 简化汉字 6763个, 7445个字符 港澳台地区使用繁体汉字 BIG5码 1995年的 GBK扩展汉字编码标准

14、 GB2312-1980的扩展 收录了 2.1万多个汉字 GBK支持 ISO 10646中的全部中、日、韩汉字 2001年 GB18030GBK 的升级 160万码位,目前汉字约为 2.6万个2.6多媒体数据 多媒体 文本, 图形、音频、视频等 多种数据表现形式,并使之在逻辑上建立联系 今天 计算机和网络都支持多媒体数据处理 相比文本 图形和图像 图形( Graphics) 几何线条、几何符号等形式表示物体的轮廓 在数据表达上 图形和图像也被认为是同类 例如, Windows的 “ 画笔 ” 程序,既可以画几何图形,也可以对图形着色使之成为图像(Picture, Image) 两种技术:位图和矢量图位图技术 微软公司提出的 又称光栅图( Raster Graphics) 使用像素( Pixel)阵列,每一个像素是一个点(Dot),点数据的大小取决于分辨率 位模式有 1、 4、 8、 16、 24及 32位等 灰度图像 每一个像素需要更多的二进制位 彩色图形、图像 R

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 其它文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号