江苏专转本计算机第5章资料

上传人:我*** 文档编号:137517794 上传时间:2020-07-08 格式:PPT 页数:76 大小:2.35MB
返回 下载 相关 举报
江苏专转本计算机第5章资料_第1页
第1页 / 共76页
江苏专转本计算机第5章资料_第2页
第2页 / 共76页
江苏专转本计算机第5章资料_第3页
第3页 / 共76页
江苏专转本计算机第5章资料_第4页
第4页 / 共76页
江苏专转本计算机第5章资料_第5页
第5页 / 共76页
点击查看更多>>
资源描述

《江苏专转本计算机第5章资料》由会员分享,可在线阅读,更多相关《江苏专转本计算机第5章资料(76页珍藏版)》请在金锄头文库上搜索。

1、第5章 数字媒体及应用,5.1 文本与文本处理 5.2 图像与图形 5.3 数字声音及应用 5.4 数字视频及应用,5.1 文本与文本处理,5.1.1 字符的编码 5.1.2 文本准备 5.1.4 文本编辑、排版与处理 5.1.3 文本的分类 5.1.5 文本的展现,5.1.1. 字符在计算机中的表示,字符、字符集及其编码表,文字的基本元素是字母和符号,统称为“字符” (character),它包括:字母、数字、标点、符号等 字符集:一组特定字符的集合 不同的字符集包含的字符数目与内容不同,如: 中文字符集、西文字符集、日文字符集等 字符的编码: 字符集中每个字符的二进位表示,称为该字符的编码

2、或代码(code) 不同的字符其编码各不相同 字符集中所有字符的编码的一览表,称为该字符集的码表,西文字符的编码ASCII码,西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符号所组成 美国标准信息交换码(ASCII码): (考点) ASCII字符集包含96个可打印字符和32个控制字符 采用7个二进位进行编码 计算机中使用1个字节存储1个ASCII 字符 存在问题: 字符集太小(只有128个字符) 不同国家和地区使用不同的字符集及其编码,互不兼容 东亚地区使用的大字符集无法编码,汉字如何编码?,汉字是记录汉语(国语,华语)的文字,属于表意文字,它用符号直接表达词或词素,有多

3、个国家和地区使用(中、日、韩、新、马) 汉字的特点 数量大;字形复杂,同音字多,异体字多 如何编码? 确定收入多少字、哪些字? 在字符集中如何排列? 使用多少个二进位进行编码?,常用的汉字编码字符集,国家标准GB2312-1980 汉字扩充规范 GBK 国家标准GB18030-2005 台湾地区的标准汉字字符集CNS 11643 (BIG 5,俗称“大五码”) 日本工业标准汉字字符集JIS X 0208-90 韩国国家标准汉字字符集KSC 5601-87 UCS/Unicode多文种大字符集,GB2312汉字编码字符集,1980年颁布信息交换用汉字编码字符集基本集GB2312-1980 GB2

4、312字符集由三个部分构成:,拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个,共6763个汉字和682个符号,每个汉字和符号都有一个确定位置,GB2312汉字的编码,每一个GB2312汉字使用16位(2个字节)表示 为了与ASCII字符相区别,每个字节的最高位均为“1” (考点),例如: “南”字的代码是11000100 11001111 (用十六进制表示为C4CF),GBK汉字内码扩充规范,GB2312的不足: 汉字字数太少,缺少繁体字,无法满足人名、地名、古籍整理、古典文献研究等应用的需要;与ASCII码不兼容 GBK汉字内码扩充规范(1995): 在GB2312基础上

5、,增加了1万多汉字(包括繁体字)和符号 共有21003个汉字和883个图形符号,如“計算機”、冃、冄、円、冇等繁体字和生僻字 与GB8312保持向下兼容,也使用双字节表示,第1字节最高位必须为“1”:,几种汉字编码的对比,5.1.2. 文本准备 文稿如何输入计算机,文字符号输入计算机的方法,键盘输入,(1)数字编码, 如电报码、区位码等, (2)字音编码, 如智能ABC等 (3)字形编码,如五笔字形和表形码等, (4)形音编码 发展趋势:基于统计和学习功能的以词语(短语)或句子作为输入单位的输入方法,文字符号输入计算机的方法,优点: 自然,流畅 小型化,适合移动计算 不足: 识别速度和正确性还

6、需提高 书写要求还要降低,文字符号输入计算机的方法,优点: 自然,方便,适合移动计算 不足: 对说话人、说话方式、说话内容的适应能力要大大增强 识别速度和正确性还需大大提高,文字符号输入计算机的方法,识别率已达到98% 功能: 简、繁体字混合识别 中文、西文混合识别 文字、表格混合识别 智能校对功能,文字符号输入计算机的方法,技术上非常困难,还无法实用 目前准备先突破工整的楷书手写体的识别!,5.1.3 文本的分类,简单文本(纯文本 ),没有字体、字号的变化,不能插入图片、表格,也不能建立超链接,其文件后缀名是 .txt 由一串用于表达正文内容的字符编码所组成,几乎不包含任何其他的格式信息和结

7、构信息 举例:,丰富格式文本,本书由南京大学出版社(Publishing House of Nanjing University)出版,有字体字号等属性变化、设置了段落和页面排版格式的文本称为“丰富格式文本” 丰富格式文本中,除了正文内容之外,还使用了许多“标记”来描述字符的属性和格式的设置。 举例:下面标题的格式为:中文用黑体,西文用Arial Black体,居中,使用HTML语言描述为:,本书由南京大学出版社(Publishing House of Nanjing University)出版,用一对指出的是标记,如 和 等,用于说明排版的格式和文字属性,它们不属于正文内容,正文内容,超文本

8、,若干文本或文本中的各个部分可按照其内容的关系互相链接起来,从而形成 “超文本”,“超链”实际上就是一个指针,用于指向其他文本块,也可以指向同一文本块中的其他部分,超链是有向的,起点位置称为链源,它可以是文本块中的一个标题、一句句子、一个关键词、一幅画、一个图标等,文本块可以是一个网页,一个文档,一段文字,也可以是一张图片,甚至一段声音或视频,小结:文本的分类,5.2 图像与图形,5.2.1 数字图像的获取 5.2.2 图像的表示与压缩编码 5.2.3 数字图像处理与应用 5.2.4 计算机图形,5.2.1 数字图像的获取,图像的获取过程,从现实世界中获得数字图像的过程称为图像的“获取” 常用

9、的图像获取设备:扫描仪、数码相机、摄像头、摄像机等 图像获取过程:,将画面划分为 M N个网格,每个网格称为 一个取样点,将彩色图像取样点的颜色分解成R,G,B三个基色,测量每个取样点的每个分量(基色)的亮度值,对取样点每个分量的亮度值进行A/D转换,使用数字整型量表示,5.2.2 图像的表示与压缩编码,数字(取样)图像的组成,数字取样图像由M(列) N(行)个取样点组成 取样点是组成数字取样图像的基本单位,称为“像素” 彩色图像的像素通常由3个彩色分量组成 灰度图像和黑白图像的像素只包含1个亮度分量,复习:黑白图象的表示,黑白图像,黑白图像的每个像素只有一个分量,且只用1个二进位表示,其取值

10、仅“0”(黑)和“1”(白)两种,例2:彩色图象的表示,彩色图像的每个像素有三个分量,分别表示三个基色的亮度,假设3个分量分别用n,m,k个二进位表示,则可表示2n+m+k种不同的颜色,数字(取样)图像的主要参数,图像大小(图像分辨率): 用来表示组成该图像的行列数目,亦即图像所包含的像素数目 使用 水平分辨率x垂直分辨率 表示 对图像清晰度和在屏幕上显示出来的大小有影响 颜色空间的类型,指彩色图像所使用的颜色描述方法,如: RGB(红、绿、蓝)模型,显示器使用 CMYK(青、品红、黄、黑)模型,彩色打印机使用 HSB(色彩、饱和度、亮度)模型,用户界面中使用 YUV(亮度、色度)模型,彩色电

11、视信号传输时使用 像素深度,即像素的所有颜色分量的二进位数目之和,举例:分辨率与图像尺寸的关系,520 x376,260 x188,130 x94,在显示比例相同时,显示在屏幕上的图像尺寸与图像分辨率成正比,数字图像的数据量,数字图像数据量的计算公式(以字节为单位): 数据量=水平分辨率垂直分辨率像素深度8 几种常用格式的图像的数据量:,例:数字图像传输时间的计算 假设数据传输速率为56 kb/s(电话上网),则传输一幅分辨率为640480的6.5万种颜色的未压缩图像的最小时间为: (640 x480 x16)/56000 = 87.8秒,数字图像的数据压缩,图像数据压缩的必要性: 节省存储数

12、字图像所需要的存储器容量 提高图像的传输速度,减少通信费用 图像数据压缩的可能性: 数字图像中有大量的数据冗余 人眼视觉有局限性,允许图像有一些失真 图像数据压缩的两种类型: 无损压缩:用压缩后的数据还原出来的图像没有任何误差 有损压缩:用压缩后的数据还原出来的图像有一定的误差 压缩编码方法的评价,数字图像的常用文件格式,不同的图象文件格式采用了不同的数据压缩技术和数据组织方法,有不同的应用 常用的图像文件格式有:,图像文件格式例1:BMP格式,BMP图像格式是Windows操作系统下使用的一种标准图像格式 支持单色、16色、256色、真彩色图像 一个文件一幅图像,可以进行无损压缩,也可不压缩

13、 非压缩的BMP文件是一种通用的图像文件格式,几乎所有Windows 应用软件都能支持,图像文件格式例2: GIF 图像,颜色数目不超过256色 ,适合用作插图、剪贴画等色彩数要求不高的场合,文件特别小,适合网络传输 GIF图像格式具有累进显示功能,适合网络浏览器观看 GIF图像格式能支持透明背景(JPEG不支持) GIF图像格式能支持动画,透明背景,图像文件格式例3:JPEG图像,JPEG是静止图像数据压缩编码的国际标准,采用JPEG标准的图像文件扩展名是 .jpg JPEG特别适合各种连续色调的彩色或灰度图像,在计算机和数码相机中已得到广泛应用 JPEG的最新标准是JPEG2000(图像文

14、件扩展名是 .jp2 ),它采用更先进的技术,可取得更好的效果,目前在医学图像处理中使用,5.2.4 计算机图形,什么是计算机图形(graphics),通过计算机和软件对景物的结构、形状与外貌进行描述(称为“建模”),然后根据该描述和选定的观察位置及光线状况,生成该景物的图形(称为“绘制”或“图像合成”) 计算机图形也称为计算机合成图像 计算机制作图形的步骤如下:,5.3 数字声音及应用,5.3.1 波形声音的获取与播放 5.3.2 波形声音的表示与应用 5.3.3计算机合成声音,5.3.1 波形声音的获取与播放,声音的特性和类型,声音由振动产生,通过空气进行传播 声音是一种波,它由许多不同频

15、率的谐波组成 谐波的频率范围称为声音的“带宽”,计算机处理的声音类型: 话音或语音(speech),专指人的说话声音,带宽仅为3003400Hz 全频带声音(如音乐声、风雨声、汽车声等),其带宽可达到20Hz20kHz 人耳可听到的声音统称“可听声”(audio) ,20Hz20kHz,数字波形声音的获取,步骤: (考点),2. 量化(quantization,模数转换 ),3. 编码(encoding),1. 取样(sampling),数字波形声音的获取设备,声音的联机获取设备(声卡) (考点),声波转换为电信号,声音的脱机获取设备:数码录音笔,取样、量化和编码,声音的重建与播放,计算机输出

16、声音分为两步: 1 声音的重建:把声音从数字形式转换成模拟信号形式,由声卡完成,2 声音播放:将模拟声音信号经处理和放大后送到音箱(扬声器) 关于音箱: 普通音箱接收的是重建的模拟声音信号 数字音箱直接接收数字声音信号,失真更小,声卡的功能与逻辑组成,波形声音的获取与编码 波形声音的重建与播放 MIDI消息的输入 MIDI音乐的合成,考点,5.3.2 波形声音的 表示与应用,数字波形声音的表示及其参数,数字波形声音是使用二进位表示的一种串行比特流,其数据按时间顺序进行组织,文件扩展名为“.wav” 数字波形声音的主要参数有: 取样频率: 语音的取样频率低,一般为8k 16k Hz 全频带声音(如音乐)取样频率高,一般为44.1k 48k Hz 量化位数:通常为8位、12位或16位 声道数目:单声道为1,双声道为2 码率(比特率),每秒钟的数据量,数字波形声音码率的计算,未压缩时数字波形声音的码率计算公式 (考点) 码率 = 取样频率 量化位数 声道数 例:,压缩编码之后数字波形声音的码率为: 压缩后的码率 = 未压缩时的码率/压缩倍数 例:上面CD唱片的立体声音乐

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号