中文信息处理

上传人:206****923 文档编号:41710417 上传时间:2018-05-30 格式:DOC 页数:5 大小:37KB
返回 下载 相关 举报
中文信息处理_第1页
第1页 / 共5页
中文信息处理_第2页
第2页 / 共5页
中文信息处理_第3页
第3页 / 共5页
中文信息处理_第4页
第4页 / 共5页
中文信息处理_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《中文信息处理》由会员分享,可在线阅读,更多相关《中文信息处理(5页珍藏版)》请在金锄头文库上搜索。

1、简述中文信息处理在国家安全领域的应用简述中文信息处理在国家安全领域的应用摘要:中文信息处理自出现以来,技术不断提高,研究领域也不断扩大。发展的同时我们也看到中文信息处理在国家安全角度应要有的任务、责任和问题。分析中文信息处理在我国的发展背景、技术隐患、技术建设和创新展望,使得对中文信息处理在国家安全领域的应用有一个清楚的认识。关键词:中文信息处理;国家安全;技术建设在多元化的信息中,文字信息是一种最普遍的形式。例如:文件、信函、报表、记录、印刷品等基本上采用文字表达的形式。“中文信息处理”一词是从 20 世纪 70 年代流行起来的。自从有了中文(汉字),即相应地出现了中文信息处理的工作1。现代

2、人们言及的“中文信息处理”包括了有关中文信息的采集、存储、传输和利用,是指利用电子计算机和现代通信、照明、排版、等自动化技术对汉字信息进行输入输出整理、加工、转换、传输、复制、等各种处理的一项新兴的科学技术。其交叉性使之成为“信息科学”的分支;其综合性应用使之成为“系统工程”的一个实例。它涉及到语言文字学、计算机科学、信息科学、工程心理学、数理统计学、声学、自动识别技术、人工智能、网络技术、文献检索学等等。故可以说它是一门新兴的多边缘科学2。1. 信息时代的国家安全1.1 信息时代的大背景语言文字信息化对国家安全的作用日益明显,语言文字信息化中的不安全因素就是国家安全的隐患。国家安全的要素呈现

3、综合化、跨国化的发展趋势,维护信息疆域安全成为维护国家主权完整的核心内容之一。信息时代国家之间相互依赖和相互影响程度越来越高,这种相互依赖使得每一个国家的行为和战略都受到了一定程度的约束。信息技术革命打破了时空的限制,国家安全主体多元化,安全空间得到了大大拓展,向上扩展到全世界,向下延伸到地区乃至个人。信息时代中国家必须综合运用经济、社会、文化、科技及环境等手段来维护国家安全。安全问题越来越呈现出国际化、全球化的发展趋势。国家安全包括了文化安全、经济安全、环境安全、资源安全、网络安全、信息化安全。信息化安全即语言文字信息化的安全,语言文字信息化对国家安全的作用完全凸显出来3。1.2 中国互联网

4、的安全隐患由于中国缺少自己语言文字信息处理技术的自主权,就可能在未来的网络战中丧失制网权,因而危及国家的安全。语言文字信息化中的不安全因素就是国家安全的隐患。中国网络用户数量迅猛发展,带宽不断增加,网络应用日益丰富,互联网承载着过重的压力。在多达 3 亿网民所使用的电脑中,芯片、操作系统、浏览器以及应用系统、数据库、防火墙、聊天工具、搜索引擎等软件目前基本上掌握在外国公司手中,因此中国互联网是经不住打击的。一旦发生紧急情况,由于没有中国语言文字信息处理的自主知识产权的软件系统,一旦维系这些重要政府部门、企业和民生等机构正常运行的网络系统崩溃,那么,就有可能给国家带来不可挽回的损失和可怕的后果。

5、1.3 我国语言文字信息化建设中的安全隐患以下从三个方面分析安全隐患:中文信息处理标准的制高点没有完全占领;中文信息处理核心技术的自主知识产权没有掌握;语言资源匮乏,不能满足中文信息处理的需要。中文信息处理用的规范标准没有完全掌握在中国人手中,造成国家利益流失及国家安全威胁。语言文字信息化标准是语言文字信息化的保障,语言文字信息化又是国家信息化的基础。在我国中文信息处理标准方面,其中GB2312-1980 信息交换用汉字编码字符集基本集为我国的汉字信息处理奠定了基础4。但是远远不够,中文软件的规范化是最为薄弱的环节,至今还没有形成技术标准。语言文字信息化的核心技术要有自己的知识产权,中文信息处

6、理从起步阶段就受到国际跨国企业的威胁。目前一些国外厂商尤其看重中文信息处理技术和产业的价值,在其本土或在中国建立研究基地、或以低廉的价格购买中国学者的研究成果、或径直购买其劳动力,来进行中文信息处理的研究。外国的信息产业,凭借其财力充足的优势,吸引了大量华人参与其中文信息处理技术的研究开发,又因其集成能力强,所以形成逼人之势,不容小视。技术上来说,我国对国外技术的跟踪和改良居多,偏重应用,而原创的新理论、新方法比较少。我们拥有自主知识产权的品牌产品还很少,具有核心竞争力的技术还数不出几样。在基础研究中,对词法、句法、语义、语用等单项技术的研究较多,对各个层面之间交互作用的研究较少。跨学科、跨语

7、言的研究还不够。国门大开,国内研发机构已无法再像上世纪 80 年代那样依靠中文屏障获得天然的领先优势。在当前的“云”时代,我们仍然落后。云计算的技术都不掌握在我们自己手中,安全问题又直接威胁着国家的安全。云计算可能对于 IT 产业链产生革命性的影响,云计算作为一个崭新名词,人们甚至还没有弄清楚它的确切定义,云安全问题就随之而来。自己的信息不会被泄露从而给自己造成不必要的损失,自己在需要时能够保证准确无误地获取这些信息等等,关于其数据安全性的质疑就一直不曾平息。语言文字信息化的资源建设,中文信息资源匮乏,不能满足中文信息处理的需要。信息技术革命所带来的一个突出的变化是由语言文字承载的知识或信息变

8、成了一种重要资源,是信息产业的资源,而且是一种战略资源。对资源的占有以及如何利用资源的知识在很大程度上决定着一个国家实力的大小。语言资源也是一种生产力,是国家的软实力。信息资源的开发利用已成为一个国家信息化进程中最为核心的问题。2.加强语言文字信息化建设2.1 中文信息处理的现状及与国际上语言信息处理的差距进入 21 世纪,面对网络时代信息的爆炸式增长,中文信息处理作为一项基础性、普适特性的信息技术,面临着挑战和再次发展的机遇,在互联网时代则显示出其优势。它的开发利用关系到我国今后信息产业乃至社会经济的发展和国家安全,具有巨大的经济价值和社会价值。中文信息处理技术自动化水平的提高,将大大促进我

9、国科技、国民经济和社会发展,同时使中华民族的文化在信息时代得到新的发展。未来无疑应当加强中文信息处理技术的研发投入与政策倾斜。我国的中文信息处理技术还有自身一系列急需解决的基础研究和应用技术问题。这些问题如果从现在起还得不到切实的加强,我们在中文信息处理事业中仅有的一些优势,就要迅速失去,那将给我国造成极大的损失。目前中文信息处理能力与国际上先进水平差距还很大。例如:自动分词和词性标注,至今还未开发出一个像日语分词系统那样被广为接受的分词标注系统。从采用的方法可以看出,随着研究的不断深入,基于统计的方法已逐渐暴露自身的缺陷,统计方法不可能解决所有的问题,还是需要结合基于规则的方法,才能在精度上

10、得以突破;中文信息处理句法分析和语义分析问题;中文信息处理应用研究的问题,比如信息输入中的键盘输入和汉字识别发展已经成熟,但语音识别却很实现,困难是要适应不同人之间的语音变化以及外界的噪音干扰;中文信息处理研究分散而且存在着低层次重复、缺乏统一规范和标准的问题;现代汉语研究领域和计算机领域的隔绝状态没有出现根本性改变;汉语文和少数民族语言文字的信息处理技术与国际水平相比,还有相当大的差距。特别是自主知识产权的成果还不多;语言资源和成果的共享还有很大局限,网络上对公众开放的中国语言文字资源还很少,远不能满足我国国民经济发展和信息化事业对中文信息处理技术的要求等等。2.2 加快语言文字信息化进程加

11、快语言文字信息化进程是国家信息化发展的迫切需要。信息化是当代社会发展的标识。语言文字的研究以及语言文字信息处理的研究从基础理论到应用技术要快速适应国家安全需要,应从如下几个方面考虑:语言战略是国家发展战略的有机组成部分,我国当前语言生活正处在快速发展变化时期,因此必须研究宏观语言战略,设计落实语言战略的行动计划。要系统研究世界上有关国家或地区以及国内语言文字规划的经验与教训。建立国家级语言战略研究机构,加快研究和制定中国语言发展战略;对国家语言安全立法保护,建立语言文化安全预警机制和监控机制,加强国家语言文化安全研究;全方位地研究我国语言文字信息化中的重大课题:完善和提高语言文字的数字化技术和

12、手段;面向信息处理的语言文字规范标准研制;国家语言文字基础资源库建设;面向互联网的汉语词语提取技术;基于语言知识的歧义消解技术;面向网络和内容的自然语言处理关键技术;面向网络的多语言处理技术;覆盖 CERNET 的基于内容的互联网监测与预警系统;面向教育的国家公共语言文字信息服务体系。应尽快启动重大项目“国家语言信息化基础设施工程建设”;国家要重视语言资源的基础建设,加大投资的力度。深度开发建设语料库及整合语言资源;语言信息技术属于交叉学科综合性技术,需要大量培养复合型人才;为语言文字信息化保驾护航。在法律上,我们缺乏对高新技术,特别是信息化产业的有效的知识产权保护,知识产权方面的法律滞后。这

13、一领域的法律,必须加大研究力度,加快出台进度,法律要为我所用,为中国的语言文字信息化所用;语言信息技术属于大型技术,需要长期规划,分阶段实施5。3.未来中文信息处理的创新发展3.1 信息化当代世界已经进入信息网络化时代,全面信息化是社会发展和科技进步的主流。信息处理技术的水平反映了一个国家和民族的生存能力、生存质量、综合竞争力。一切竞争都集中反映在信息的获取、传输、处理和运用技术上。应该把推进社会全面信息化作为中文信息处理基础应用研究的首要任务。3.2 智能化计算机实现由数据处理到信息处理跨越的那一刻,信息工程界的先驱者们开始了计算机智能化的研究。虽然历史不长,但是,初始化的灵感与冲动给人们描

14、述了美好而诱人的前景。计算机究竟能不能获得智能,如何获得智能,以及计算机智能与人类智能的同质性和异质性,等等,尽管目前还没有答案,但可以肯定地说,计算机人工智能与语言文字信息处理智能化密切相关。应该充分认识到,中文信息处理智能化与我国的社会发展、科技进步、文化教育、经济建设以及国家安全有着密切关系。信息处理技术智能化的竞争是一个没有硝烟的战场。在这场关系到民族和国家生存、发展的竞争中,只能前进,不能后退,只能成功,不能失败。3.3 工程化中文信息处理工程化是信息网络时代的重要特征之一。应当从系统工程的角度看待和从事中文信息处理基础应用的创新研究,处理好汉化、兼容与自主创新的关系。 3.4 国际

15、化中文信息处理技术已成为世界瞩目的热点。单纯从经济目的出发,也足以吸引世界发达国家信息工程界有识之士的目光。微软、IBM 等多家外国计算机公司在我国设立研究所,聘用我国信息处理人才,在汉字编码、汉字识别、语音识别等许多领域,投入巨额经费,从事中文信息处理智能化的研究。事实证明,中国要走向世界,中文也要走向世界,国际化是我国信息处理发展的必然趋势。3.5 标准化汉语没有严格意义的形态标志这一特点,使西方计算语言成果和经验不能完全适用,同时增加了计算机自动分词识别和句法语义分析的难度。因此,汉语言文字的规范化已经成为中文信息处理智能化的瓶颈。在信息技术和信息产业方面,永远是“一流出标准,二流出技术

16、,三流出人工”。如何把汉语言文字规范化的成果变成全世界都遵守的标准,把汉语言位子信息资源变成巨大无比的财富,应当成为当前和未来中文信息处理基础应用研究的首要课题。参考文献:1 郭艳华,周昌乐.自然语言理解研究综述.杭州电子工业学院学报.2000.2.20(1).2 冯志伟.国外自然语言理解系统简介.计算机科学.1984 年第 2 期.8 宁春岩.自然语言理解中的几个根本问题.语言研究.1985(2).3 詹卫东.80 年代以来汉语信息处理研究述评.当代语言学.2000.2(1).4 中国中文信息学会.我国中文信息处理的发展与展望.中国科学技术协会“科学技术面向新世纪“学术年会.1998.9.137-140.5 中国互联网络信息中心.中国互联网络发展状况统计报告(2002/7).2002.7.5.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号