数据压缩原理

上传人:汽*** 文档编号:563756133 上传时间:2023-10-12 格式:DOC 页数:14 大小:128.54KB
返回 下载 相关 举报
数据压缩原理_第1页
第1页 / 共14页
数据压缩原理_第2页
第2页 / 共14页
数据压缩原理_第3页
第3页 / 共14页
数据压缩原理_第4页
第4页 / 共14页
数据压缩原理_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《数据压缩原理》由会员分享,可在线阅读,更多相关《数据压缩原理(14页珍藏版)》请在金锄头文库上搜索。

1、AIX 上总有一种压缩方式适合你当今世界每天产生大量的数据,有些数据我们需要进行压缩,压缩数据的好处不言而喻:节省空间;方便传输;加密保护等等。很多压缩工具应运而出,每种工具都有自己的特点。对于 AX 平台上的压缩方法也很多 ops、ac、gzip、px、ar等等。本文将首先简单介绍一下压缩的基本原理然后详细介绍 AIX 平台的常用压缩工具并针对它们各自的特色进行比较,让读者对对AIX平台的压缩有针对性的认识,从而能够根据不通的需要选择合适的压缩工具数据压缩的原理数据压缩是指在不丢失信息的前提下,缩减数据量以减少存储空间,提高其传输、存储和处理效率的一种技术方法。或按照一定的算法对数据进行重新

2、组织,减少数据的冗余和存储的空间.数据压缩包括有损压缩和无损压缩。无损压缩是可逆的;有损压缩是不可逆的。计算机处理信息是以二进制数(0 和 1)的形式表示的,压缩软件把二进制信息中相同的字符串以特殊字符标记起来,从而实现缩小文件大小来达到压缩的目的。压缩的理论基础是信息论从信息的角度来看,压缩就是去除掉信息中的冗余,即去除掉确定的或可推知的信息,而保留不确定的信息,也就是用一种更接近信息本质的描述来代替原有的冗余的描述,这个本质的东西就是信息量。数据压缩的硬件和软件工具也非常多,本文将针对 I 平台常见的几种数据压缩工具进行介绍和比较并提供常用的示例进行解说,希望您能从中选择合适的压缩工具进行

3、压缩。IX平台上,通常我们看到的 。Z .gz 。 rar 后缀的文件都是压缩文件通过 ompress 可以生成 . 压缩文件,通过 copress、ucompres、gzip可以解压 。Z 格式的压缩文件;通过gzip可以生成。z压缩文件,通过gzip可以解压 。g格式的压缩文件;通过 pc可以生成.z 压缩文件,通过unpa、gzip可以解压 。z 格式的压缩文件;通过px可以生成 。ar压缩文件,通过pax可以解压 。ar格式的压缩文件;通过pax、tar可以生成 .tar 压缩文件,通过px、tar、uar、可以解压 。tar 格式的压缩文件。图1描述了各种类型文件的压缩及解压可以选择

4、的 X 工具。图 1. 不同文件类型的压缩及解压下面我们将详细介绍 X上主要压缩工具的特点已经用法。回页首oprescpres 是一个相当古老的 UNI 档案压缩指令,利用自适应的 Lempel-Zv 编码来减少文件大小.每一个被参数 File 指定的原文件将被可能的压缩文件所代替,压缩后的档案会加上一个.Z.延伸档名以区别未压缩的档案,压缩后的档案可以以 unompre 解压.值得注意的是执行 mres 需要有相应的权限来替换文件.压缩量依赖于输入大小、由its 变量指定的单位编码的比特数和公共子串的分布。典型地,源代码或英文文本将减少 50% 到0。特点 如果调用压缩进程有适当的权限,压缩

5、文件将保留与原文件相同的所有权、方式和修改时间。 如果指定的文件的路径大于 103 字节,该命令不工作。 如果没有指定文件,标准输入将被压缩到标准输出。 如果压缩没有减少文件大小,将对标准错误写一个消息而不替换原文件. coress 命令的压缩一般比利用哈夫曼编码或自适应哈夫曼编码实现的压缩更紧凑,计算时间更少,(哈夫曼编码在 pack 命令中被使用)。 若要将数个档案压成一个压缩档,必须先将档案 tar 起来再压缩常用示例1. $mpssv sm。op s。ot: Comression:1。14% This fie is replaced with ds.opt。Z。该命令压缩sm。opt

6、文件,v参数将程式执行的讯息印在荧幕上。标准输出显示压缩百分比为1 .dm。opt 文件被压缩并重命名为dsm。opt。Z.2. $compress b 2 dsm.l该命令指定文件中公共子串的比特的最大值为 1.-b 参数设定共同字串数的上限,以位元计算,可以设定的值为 9至 1 its。由于值越大,能使用的共同字串就越多,压缩比例就越大,所以一般使用预设值16bi.3. comprss dfdsm。ot。该命令将dsm。t。Z解压成 dsm。pt,若档案已经存在 -d程式则会自动覆盖档案。由于系统会自动加入 。 为延伸档名,所以该命令中m。o。Z写成m.ot也会当作s。opt。来处理。Z回

7、页首ucmpesmress的解压也可以由 ncomress 来完成。uncompress 命令恢复由copres 命令压缩的原文件。uncopess 命令恢复由 press命令压缩的原文件。每个由 ile 参数指定的压缩文件被除去而由展开后的副本所替换。展开后的文件与压缩的版本名字相同,但没有 。Z 扩展名。如果用户有r 用户权限,展开后的文件保留与原文件相同的所有者、组、方式和修改时间。如果用户没有 rot 用户权限,则文件保留相同的方式和修改时间,但获取新的所有者和组。如果没有指定文件,则标准输入将展开为标准输出。示例$nomrss dsm。opt.Z该命令解压ds。ot文件,并重命名为d

8、s。opt.回页首packpack 命令以压缩格式存储由 i 参数指定的文件。输入文件由一个原文件名附加z 后缀的压缩文件所代替。压缩文件维持了同原始文件同样的访问方式、访问和修改日期和所有者。输入文件名包含不超过 3个字节,以允许有空间添加 。后缀。如果 ck 命令成功执行,原始文件就被除去。如果 pck 命令不能创建更小的文件,它就停止处理并报告不能节省空间.(节省空间失败通常发生于小文件或者是统一字符分布的文件。)空间节省的数额取决于输入文件的大小和字符分布频率。由于译码树形成了每个 。 文件的第一部分,因此对于小于 3 个块的文件不会节省空间典型情况下,文本文件减少 到 4。文件位置/

9、usr/binpck特色 采用 uf 编码来压缩文件。因此 pack 命令始终只能压缩小于 M 的文件. pac 命令在下列任何一个条件下都不能压缩:文件已经压缩过;输入文件名超过了 253 个字节;文件有链接;文件是目录;文件不能打开;不能通过压缩节省存储块;名称为File.z的文件已经存在;.z 文件不能创建;处理中发生/ 错误.示例1. $ack ds。sys dsmsysi2. pack: dm。sys:isfis redcedi ze %.pac:dsm。sys.ini: is fileisreucd in size7。5。该命令压缩名为 dsm。sy 和 dm。sy.ini 的文件

10、并显示修改的文件名.压缩的版本重命名为.ot.和dm。s.z。此 pac 命令显示每个压缩文件的文件大小减小百分比3. pack sm。ys4. pack:dm。s:This f s redcdiize 47.。 5. The file chnged frm 696 315bytes 6. The ffman tee has lvesbelow te ro。 7. Therere 49 itinct bteinipt。 8. h dictoary ovehadis 67 byts9. h eeive entropy is 4.21bits per yte。 Thampttic entr i .

11、1 it per bte。该命令压缩名为 swcl。log 的文件并显示该文件的统计信息。回页首unpackunpack 命令展开由pak命令创建的文件。对每个指定的文件,unck 命令搜索名为Fi。z的文件。如果这个文件是压缩文件,则upack 命令用其展开的版本来替换它。upack 命令通过从 ile 除去 。z后缀来给新的文件命名。如果用户有 roo 用户权限,则新的文件具有和原文件一样的访问方式、访问和修改时间、所有者和组。如果用户没有root用户权限,则该文件保留同样的访问方式、访问时间和修改时间,但获取新的所有者和组upak命令仅对以 。 结束的文件进行操作。结果,当指定不以 .z

12、 结束的文件名时,unck添加该后缀并搜索目录以寻找带有这种后缀的文件名。文件位置/ubin/unpack特色 如果正在解压的文件有链接,unpck 命令会把警告写到标准错误。与其来源的压缩文件比较,新解压的文件有不同的索引节点但是,任何其它链接到压缩文件原索引节点的文件仍然存在,仍然处于压缩状态。 以下情况则文件不能解压:文件名(除 。z文件之外)多于 253 字节;文件不能打开;文件不是压缩文件;有展开文件名的文件已存在;不能创建被解压的文件。示例 unpack dm.ys. dsm。ys。ininpac: dsm.sys:his leis now npaced. unpack: dsm.

13、sys.ini: Thifie isnownpakd.该命令展开了压缩文件dsm.ss。z和dsm。sysni.z,并用名为ds.ys 和s。ys。ini的文件来替换它们.npack 命令的文件名可以带有或不带 . 后缀。回页首pax抽取、写以及列出归档文件成员;复制文件和目录层次结构。r 和-w 标志指定了归档操作的类型.通过a主要可以实现 4大功能包括:列出已归档文件的成员文件(列表方式);使用r 标志抽取归档文件(读取方式);使用 w 标志写归档文件(写方式)用r 和 w 标志复制文件(复制方式)。pax命令应该是用于系统转储和 2 GB 以上的映像的首选存档方法。pax命令还可以用于查

14、看和修改tar和cpi格式的文件,下面的示例中将会给出相应解释。文件位置sri/pax特点 系统缺省支持 4 位PIX 定义的数据格式.目的是允许归档大文件,例如 d文件。归档文件大小可以大于或等于G 支持长用户名(或组名) 支持大于207151的超大UID/GID 支持长路径名或链接名 用 -o 标志可以修改归档算法注意事项 在读取或复制方式下,如果需要中间目录来抽取归档成员,ax执行与mk子例程相同的操作,中间目录作为路径参数,值 S_IRWXU 作为方式参数。 如果没有任何指定的模式或文件操作数与至少一个文件或归档成员匹配,x为每个不匹配的模式或文件操作数写一条诊断消息到标准错误,并以错误状态退出. 遍历目录过程中,pax将检测无限循环;例如,进入一个作为最后访问文件的祖先的先前访问的目录。在检测到无限循环时,px将诊断消息写到标准错误然后终止。 当pa处于读取方式或列表方式,使用 -x归档格式和文件名、链接名、所有者名或任何其他扩展的头记录

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号