文本信息加工幻灯片

上传人:F****n 文档编号:88153961 上传时间:2019-04-20 格式:PPT 页数:30 大小:2.42MB
返回 下载 相关 举报
文本信息加工幻灯片_第1页
第1页 / 共30页
文本信息加工幻灯片_第2页
第2页 / 共30页
文本信息加工幻灯片_第3页
第3页 / 共30页
文本信息加工幻灯片_第4页
第4页 / 共30页
文本信息加工幻灯片_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《文本信息加工幻灯片》由会员分享,可在线阅读,更多相关《文本信息加工幻灯片(30页珍藏版)》请在金锄头文库上搜索。

1、,主讲教师:刘洪强 e_mail :,第四章 文本和表格信息加工,2,本章目录,文本和表格信息加工是人性化信息加工的两类重要应用,通过本章的学习,你将进一步体验和认识文本信息加工和表格信息加工的实际价值,特别是如何根据需要选择适当的表达方式去有效地表达信息。本章需要你勤于动手、善于思考,从中总结经验、发现规律。,4.1 本文信息加工,4.2 表格信息加工,3,4.1 文本信息加工,学习目标,体验文字处理技术的发展变化及其意义; 了解文字在计算机中的编码方式,文本信息加工,4.1.1 文字及其处理技术,一、体验文字处理技术,文字是人类为了更加流畅地表述意义,传递经验发明的工具,人们利用文字记载自

2、然变化、历史沿革、生产经验、建设成果等各种信息,极大促进人类文明的发展进程。,思考:汉字是怎么造出来的?,1.概述,汉字的造字法有四种:象形、指事、会意、形声。,从字体上看,就是本字倒过来。上部为树头,下部为树梢,在树梢上加一小横,就表示这里是树梢。因此,末的最初的意义是树梢。(上、下、刃等),象形,指事,象形文,2.汉字的造字法,金文明为日月幷照之会意字。(信=人+言),会意,形声,字的一部分是“形旁”表示字义,一部分是“声旁”表示读音,如: “清”是“水”形“青”声,“河”是“水”形“可”声。,猜一猜:以下象形字分别是什么?,(休),(采),(焚),(甘),(刃),东巴文字,东巴文是一种原

3、始的图画象形文字,主要为东巴教徒传授使用,书写东巴经文,故称东巴文。纳西话叫“思究鲁究”,意为“木迹石迹”,见木画木,见石画石 。,东巴文字是唯一活着的象形文字。,云南 纳西族 东巴文字,猜猜看,上面的象形文字究竟表示什么意思?,靠,睡,登,越,喝,牙齿,看书,去,东巴象形文字是目前世界上仅存的为数不多的古象形文字之一,并且是世界上唯一仍在使用的古象形文字,是文字史上的活化。 东巴象形文字在工艺美术设计具有很高的审美价值。,思考:中国汉字的发展过程是怎么样的?,文字之旅:第1站甲骨文,3.文字之旅,金文,文字之旅:第2站金文,小篆,大篆,文字之旅:第3、4站大篆、小篆,隶书(张迁碑),草书(张

4、旭),行书(王羲之),文字之旅:第N站隶书、草书、行书,4书法是一种凝结了我国民族文化精髓的特殊的艺术形式,兰亭集序(局部) 晋王羲之,徐冰方块英文,将26个字母改造成类似中国汉字的偏旁部首,Art For The People,Ti yan qing jing : pin yin yu han zi 体验情境:拼音与汉字,村居 (清) 高 鼎 草长莺飞二月天, 拂堤杨柳醉春烟。 儿童散学归来早, 忙趁东风放纸鸢。,计算机文字处理技术发展,只能处理拉丁字母以及一些控制符号,过去,可处理包括象形文 字在内的任何文字,现在,ASCII码(美国标准信息交换码),可以表示128个字符 GB2312(1

5、980年)一共收录了7445个字符 Big5(1984), 一共收录了13060个字符 GBK1.0 (1995),收录了21886个符号 GB18030 (2000),收录了27484个汉字和主要的少数民族文 字 Unicode( 1994,统一码、万国码),它为每种语言中的 每个字符设定了统一并且唯一的二进制编码,以 满足跨语言、跨平台进行文本转换、处理的要求。,小结: 从ASCII、GB2312到GBK1.0、GB18030 ,这些编码方法是向下兼容的,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更多的字符。在这些编码中,英文和中文可以统一地处理。,中文信息处理技术发展简史,

6、20世纪80年代初,CCDOS成为我国第一个汉字操作系统; 1983年,“王码五笔字型”输入法,突破了汉字数字化的瓶颈; 1984年,联想公司成立并推出联想汉卡; 1985年5月,北大方正研制的激光照排II型机,迎来了印刷业“告别铅与火,迈入光与电”的时代; 1989年9月,金山公司发布了中文字处理系统WPS 1.0; 1992年,PTDOS 1.0;1993年10月发布UCDOS 3.0;1994年到1997年先后开发出UCDOS 3.1UCDOS 7.0; 1993年Windows 3.2发布,这是第一个简体中文版的Windows操作系统,此后Windows及其中文版本不断升级; 1999

7、年,中国新一代的国产操作系统红旗Linux推出。,1.历史上使用的文字处理技术,手写,刻字,雕版印刷,活字印刷,机械式 打字机,计算机 文字处理,计算机文字处理,只能处理英文,可处理包括象形文 字在内的任何文字,如何在计算机中处理汉字?,二、汉字的编码,2.汉字的编码,目前计算机上使用的汉字编码主要有三种:,输入码 (外码),机内码 (内码),输出码 (字型码),用于输入汉字的编码,用于存储汉字的编码,用于输出汉字的编码,区位码 :4860 全拼编码:xiong 五笔字型:CEXO,熊,用机内码 表示、存储,如国标码(GB)和 BIG5码,用汉字字型 输出汉字,输入码(外码): 用于输入汉字,

8、如区位码、拼音码、王码(五笔字型)、自然码等。 机内码(内码): 供计算机系统内部进行存储、加工处理、传输而统一使用的代码,用于储存汉字,如国标码(GB)、BIG5码等。 输出码(字型码): 存储在计算机内的汉字在屏幕上显示或打印机打印出来时,必须以汉字字型输出,汉字的输出码实际上是汉字的字型码,它是由汉字的字模信息所组成的。 汉字是一种象形文字,每个汉字都是一个特定图形,这种图形可以用点阵、向量等方式表示。,字模(点阵、向量)如8*8点阵,Bit (位) Byte (字节) B 1B=8bit 1KB=1024B 1MB=1024KB 1GB=1024MB 1TB=1024GB,如32*32

9、点阵就需要:32*32位=32*32/8B=128B,用8*8点阵表示一个“中”字,这个汉字占8行,每一行8个点,其中每一个点用一个二进制位表示,值“0”表示没有笔形,值“1”表示有笔形,储存这个字型码需要88=64位二进制,即8个字节(1字节=8位二进制)。,计算机汉字的处理过程,例:“春”字在计算机中的处理过程,1.从键盘用拼音输入法输入外码“chun”; 2.从外码表中找出与之对应的汉字机内码; 3.按照“机内码”找到存放字型码的地址; 4.取出“字型码”在屏幕上显示出来。,三、总结,体验文字处理技术的发展变化及其意义; 了解文字在计算机中的编码方式,判断(true/false) 1.汉字起源于象形文字,至今仍保留了象形文字的特点。( ) 2.TB,MB,GB,KB中数量级最大的是GB。( ),四、课堂过关练习,T,F,320世纪80年代初,我国第一个汉字操作系统是CCDOS,它的问世带动了中文软件平台的开发。( ) 4目前,计算机上汉字编码的形式主要有输入码、机外码和输出码三种。( ) 5. 计算机只能识别二进制数0和1代码。( ),T,T,F,Thank You !,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号