wxq文本信息加工

上传人:新** 文档编号:570903957 上传时间:2024-08-07 格式:PPT 页数:33 大小:3.14MB
返回 下载 相关 举报
wxq文本信息加工_第1页
第1页 / 共33页
wxq文本信息加工_第2页
第2页 / 共33页
wxq文本信息加工_第3页
第3页 / 共33页
wxq文本信息加工_第4页
第4页 / 共33页
wxq文本信息加工_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《wxq文本信息加工》由会员分享,可在线阅读,更多相关《wxq文本信息加工(33页珍藏版)》请在金锄头文库上搜索。

1、4.1文本信息加工LOGO文本信息加工例子文本信息加工例子文本信息加工例子文本信息加工例子LOGOLOGOLOGO4.1.1 文字及其处理技术文字及其处理技术 文字是人类为了更加流畅地表述意义,传递文字是人类为了更加流畅地表述意义,传递经验发明的工具,人们利用文字记载自然变化、经验发明的工具,人们利用文字记载自然变化、历史沿革、生产经验、建设成果等各种信息,极历史沿革、生产经验、建设成果等各种信息,极大促进人类文明的发展进程。大促进人类文明的发展进程。思考:汉字是怎么造出来的?思考:汉字是怎么造出来的?LOGO汉字的造字法有四种:象形、指事、会意、形声。汉字的造字法有四种:象形、指事、会意、形

2、声。 从字体上看,就是本字倒从字体上看,就是本字倒过来。上部来。上部为树头,下部,下部为树梢,在梢,在树梢上加一小横,就表示梢上加一小横,就表示这里是里是树梢。因此,末的最初的意梢。因此,末的最初的意义是是树梢。梢。(上、下、刃等)(上、下、刃等) 象形象形象形象形指事指事指事指事象形文象形文汉字的造字法汉字的造字法用图画依照物体的形状或者样子描绘出来表示的文字将一些很难解释的事物当做一个字。LOGO金文明为日月幷照之会意字。(信金文明为日月幷照之会意字。(信=人人+言)言) 会意会意会意会意形声形声形声形声 字的一部分是字的一部分是“形旁形旁”表示字义,一部分是表示字义,一部分是“声旁声旁”

3、表示表示读音,如:读音,如: “清清”是是“水水”形形“青青”声,声,“河河”是是“水水”形形“可可”声。声。 指把两个字拼在一起变成另一个字一般是将两字和在一起变成另一个字,一边表示声音,一边表示形态LOGO猜一猜:以下象形字分别是什么?猜一猜:以下象形字分别是什么?(休)(采)(焚)(甘) (刃)LOGO东巴文字东巴文字 东巴文东巴文是一种原始的图画象形文字,主要为是一种原始的图画象形文字,主要为东东巴教徒巴教徒传授使用,书写东巴经文,故称东巴文。传授使用,书写东巴经文,故称东巴文。纳西话叫纳西话叫“思究鲁究思究鲁究”,意为,意为“木迹石迹木迹石迹”,见木画木,见石画石见木画木,见石画石

4、。东巴文字是唯一活着的象形文字。东巴文字是唯一活着的象形文字。LOGO东巴文字东巴文字LOGO云南云南 纳西族纳西族 东巴文字东巴文字猜猜看,上面的象形文字究竟表示什么意思?猜猜看,上面的象形文字究竟表示什么意思?靠靠睡睡登登越越喝喝牙齿牙齿看书看书去去LOGO思考:中国汉字的发展过程是怎么样的?思考:中国汉字的发展过程是怎么样的?LOGO文字之旅:第文字之旅:第1站站甲骨文甲骨文龟壳龟壳兽骨兽骨1.文字是人类为了更加流畅地表述意义、传递经验而发明的工具。文字是人类为了更加流畅地表述意义、传递经验而发明的工具。甲骨文甲骨文 殷周时代金文金文 西周、春秋战国文字战国文字 春秋战国小篆小篆 秦朝隶

5、书隶书 秦朝楷书楷书 东汉行书行书 南北朝草书草书 西汉印刷字体印刷字体 宋朝徐冰徐冰方块英文方块英文将将26个字母改造成类似中国汉字的偏旁部首个字母改造成类似中国汉字的偏旁部首Art For The PeopleTi yan qing jing : pin yin yu han zi 体验情境:体验情境:拼音与汉字村居村居 (清) 高 鼎 草长莺飞二月天,草长莺飞二月天, 拂堤杨柳醉春烟。拂堤杨柳醉春烟。 儿童散学归来早,儿童散学归来早, 忙趁东风放纸鸢。忙趁东风放纸鸢。 实践:搜索拼音的来历、作用、与汉字的关系?在中国古代,由于没有标准的汉语拼音方案,人们在教学生字时,常使用两个常见的字进

6、行反切或直拼出这个生字的读音。这个方法显然太繁琐,不易读准。由于古代没有标准的拼音方案,致使很多汉字古代的读音与现在的读音完全不同。给中华民族的兴起起到了一定的阻碍作用。汉语拼音是中华人民共和国的汉字拉丁化方案,于1955年1957年文字改革时被原中国文字改革委员会汉语拼音方案委员会研究制定。该拼音方案主要用于汉语普通话读音的标注,作为汉字的一种普通话音标。1958年2月11日的全国人民代表大会批准公布该方案。1982年,成为国际标准ISO 7098思考:拼音能取代汉字吗?中文信息处理技术发展简史中文信息处理技术发展简史20世纪世纪80年代初,年代初,CCDOS成为我国第一个汉字操作系统;成为

7、我国第一个汉字操作系统;1983年,年,“王码五笔字型王码五笔字型”输入法,突破了汉字数字化的瓶颈;输入法,突破了汉字数字化的瓶颈;1984年,联想公司成立并推出联想汉卡;年,联想公司成立并推出联想汉卡;1985年年5月,北大方正研制的激光照排月,北大方正研制的激光照排II型机,迎来了印刷业型机,迎来了印刷业“告别铅与火,迈入光与电告别铅与火,迈入光与电”的时代;的时代;1989年年9月,金山公司发布了中文字处理系统月,金山公司发布了中文字处理系统WPS 1.0;1992年,年,PTDOS 1.0;1993年年10月发布月发布UCDOS 3.0;1994年到年到1997年先后开发出年先后开发出

8、UCDOS 3.1UCDOS 7.0;1993年年Windows 3.2发布,这是第一个简体中文版的发布,这是第一个简体中文版的Windows操操作系统,此后作系统,此后Windows及其中文版本不断升级;及其中文版本不断升级;1999年,中国新一代的国产操作系统年,中国新一代的国产操作系统红旗红旗Linux推出。推出。LOGO历史上使用的文字处理技术历史上使用的文字处理技术手写手写刻字刻字雕版印刷雕版印刷活字印刷活字印刷机械式机械式打字机打字机计算机计算机文字处理文字处理计算机文字处理计算机文字处理只能处理英文只能处理英文可处理包括象形文可处理包括象形文字在内的任何文字字在内的任何文字如何在

9、计算机中处理汉字?如何在计算机中处理汉字?汉字的编码汉字的编码 “在在QQ对话框中,对话框中, 按住按住 ALT 键键 ,然后顺序按,然后顺序按 小小 键盘键盘 2 9 4 8 2 ,松,松 ALT 键。将会出现键。将会出现 你的名字。很神奇!你的名字。很神奇!” ASCII码(码(American Standard Code for Information Interchange,美国标准信息交换码)是属于机内码。,美国标准信息交换码)是属于机内码。 汉字的编码汉字的编码 全拼编码:全拼编码:zhuzhu五笔字型:五笔字型:eftjeftj猪猪用机内码用机内码表示、存储表示、存储用汉字字型用

10、汉字字型输出汉字输出汉字 宋体宋体猪猪键盘输入键盘输入(输入码输入码)编码转换编码转换(机内码机内码)编辑与输出编辑与输出(输出码输出码)计算机处理文字过程计算机处理文字过程LOGO汉字的编码汉字的编码目前计算机上使用的汉字编码主要有三种:目前计算机上使用的汉字编码主要有三种:输入码输入码(外码)(外码)机内码机内码(内码)(内码)输出码输出码(字型码)(字型码)用于用于输入汉字输入汉字的编码的编码用于用于存储汉字存储汉字的编码的编码用于用于输出汉字输出汉字的编码的编码区位码区位码 :4860全拼编码:全拼编码:xiong五笔字型:五笔字型:CEXO熊熊用机内码用机内码表示、存储表示、存储如国

11、标码(如国标码(GB)和)和BIG5码码用汉字字型用汉字字型输出汉字输出汉字LOGO输入码(外码):输入码(外码): 用于输入汉字,如区位码、拼音码、王码(五笔字型)、用于输入汉字,如区位码、拼音码、王码(五笔字型)、自然码等。自然码等。机内码(内码):机内码(内码): 供计算机系统内部进行存储、加工处理、传输而统一使供计算机系统内部进行存储、加工处理、传输而统一使用的代码,用于储存汉字,如国标码(用的代码,用于储存汉字,如国标码(GBGB)、)、BIG5BIG5码等。码等。 LOGO输出码(字型码):输出码(字型码): 存储在计算机内的汉字在屏幕上显示或打存储在计算机内的汉字在屏幕上显示或打

12、印机打印出来时,必须以汉字字型输出,汉字印机打印出来时,必须以汉字字型输出,汉字的输出码实际上是汉字的字型码,它是由汉字的输出码实际上是汉字的字型码,它是由汉字的字模信息所组成的。的字模信息所组成的。 汉字是一种象形文字,每个汉字都是一个汉字是一种象形文字,每个汉字都是一个特定图形,这种图形可以用点阵、向量等方式特定图形,这种图形可以用点阵、向量等方式表示。表示。LOGO 字模(点阵、向量)如字模(点阵、向量)如8*88*8点阵点阵 00010000 00010000 11111110 10010010 11111110 00010000 00010000 00010000 Bit (位) B

13、yte (字节) B1B=8bit1KB=1024B1MB=1024KB1GB=1024MB1TB=1024GB如如32*32点阵就需要点阵就需要:32*32位位=32*32/8B=128B用用8*8点阵表示一个点阵表示一个“中中”字,这个汉字占字,这个汉字占8行,每一行,每一行行8个点,其中每一个点用一个二进制位表示,值个点,其中每一个点用一个二进制位表示,值“0”表示没有笔形,值表示没有笔形,值“1”表示有笔形,表示有笔形,储存这个储存这个字型码需要字型码需要88=64位二进制,即位二进制,即8个字节(个字节(1字节字节=8位位二进制)二进制)。LOGO计算机汉字的处理过程计算机汉字的处理

14、过程键盘输入键盘输入(输入码)(输入码)编码转换编码转换(机内码)(机内码)编辑与输出编辑与输出(字型码)(字型码)实践1、按国际通用标准,“A lazy youth,a lousy age”在计算机内存储时采用的编码是( ) A 、区位码 B、字形码 C、ASCII 码 D、 处理码2、使用WORD 进行汉字处理时,伴随“输入存储打印”的过程,所涉及的汉字编码分别是( ) A、拼音码、机内码、交换码 B 输入码、机内码、字型码 C、输入码、机内码、打印码 D、拼音码、ASCII码、字形码 3、如图所示是一个8X8像素的汉字点阵图,假如用0表示白色,1表示黑色,请选出该汉字编码信息所占字节数及

15、第一行图像信息的二进制编码。A、64,11011011B、8, 00100100C、16,00100100D、8, 11011011问题情境:问题情境:丁丁是高一(18)班长,开学时要安排值日表,丁丁的计算机基础较好,于是就想通过电脑编制这个表格,以后修改更方便。可是,在他输入学生姓名的的时候,碰到了几个姓名怎么输也输不进去,你能帮他解决这个问题吗? 体验文字处理技术体验文字处理技术汉字的编码汉字的编码文字文字及其及其处理处理技术技术输出码输出码(字型码字型码)汉字的输出汉字的输出机内码机内码(内码内码)汉字的存储汉字的存储输入码输入码(外码外码)汉字的输入汉字的输入书法是一门凝结了我国民族文

16、化精髓的艺术书法是一门凝结了我国民族文化精髓的艺术汉字的创造饱含民族的智慧汉字的创造饱含民族的智慧文字的发明是为了更流畅地表述意义、传递经验文字的发明是为了更流畅地表述意义、传递经验中文信息处理技术发展历史中文信息处理技术发展历史课堂课堂小结小结(教学重点)(教学难点)1、体验东巴文字的计算机处理技术、体验东巴文字的计算机处理技术安装安装“东巴文字东巴文字”输入法,打出输入法,打出“中午中午”、“晚上晚上”的东巴字。的东巴字。2、学会使用多种汉字编码输入汉字、学会使用多种汉字编码输入汉字3、根据信息需求,选择合适的字处理软件进行处理、根据信息需求,选择合适的字处理软件进行处理上机实践上机实践End

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号