关于少数民族语言文字信息化建设

上传人:豆浆 文档编号:33428329 上传时间:2018-02-15 格式:DOC 页数:15 大小:33KB
返回 下载 相关 举报
关于少数民族语言文字信息化建设_第1页
第1页 / 共15页
关于少数民族语言文字信息化建设_第2页
第2页 / 共15页
关于少数民族语言文字信息化建设_第3页
第3页 / 共15页
关于少数民族语言文字信息化建设_第4页
第4页 / 共15页
关于少数民族语言文字信息化建设_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《关于少数民族语言文字信息化建设》由会员分享,可在线阅读,更多相关《关于少数民族语言文字信息化建设(15页珍藏版)》请在金锄头文库上搜索。

1、1关于少数民族语言文字信息化建设胡锦涛总书记在党的十七大报告指出:“运用现代科技手段开发利用民族文化丰厚资源,加强对各民族文化的挖掘和保护,重视文物和非物质文化遗产保护,做好文化典籍整理工作。 ”胡总书记还指出,要让互联网成为传播社会主义先进文化的新途径、公共文化服务的新平台、人们健康精神文化生活的新空间,促进社会主义文化事业和文化产业的健康发展;要以积极的态度、创新的精神,大力发展和传播健康向上的网络文化,切实把互联网建设好、利用好、管理好。1、基本情况我国少数民族语言文字信息化工作始于上世纪80年代,20多年来取得长足发展。目前已有多种传统通用民族文字编码字符集、字型、键盘国家标准和国际标

2、准;开发了一批应用软件,一些软件已实现 Windows 系统上的运行;各类数据库及专业应用软件不断问世;蒙、藏等几种文字有了电子出版系统、办公自动化系统;蒙、藏、朝、维吾尔、彝等文种的网站或网页初步建成;民族文字识别和机器辅助翻译等也有了一定进展。通过搜集整理各民族文字建立的“ 中华大字符集” ,为收集、整理、保存和抢救我国民族文化遗产工程打下基础。2目前,蒙、藏、维、彝等民族语言文字信息化建设走在了前列。以藏文为例,1984年藏文即实现信息处理。1993年,我国开始藏文信息技术标准化工作。1997年7月,藏文成为我国少数民族文字中第一个具有国际标准的文字。藏文软件开发工作也于1998年列入自

3、治区科委863计划。2005年7月,西藏藏语言文字网开通。2007年5月, “藏文拉丁转写国际标准”在京通过专家鉴定。近年来,我国民族语言文字在计算机、网络中的应用越来越广泛;除了计算机操作系统,少数民族语言文字信息化还被广泛应用在日常电子通讯中。2004 年 1 月,我国推出第一款少数民族语言文字手机,即维吾尔文手机。2007 年,中国移动内蒙古公司又成功推出了蒙古文手机,为蒙古族用户提供更加快捷、方便的服务。现在,民族同胞不但能通过网络获取天气预报、科技新闻等信息,而且可以利用本民族语言收发手机短信。2005 年 9 月,永中 Office 在已经有简体中文版、繁体中文版、英文版、日文版的

4、基础上,推出了维、哈、柯文版办公软件。永中 Office 维、哈、柯文版,根据维、哈、柯文用户的语言和书写习惯,从界面及菜单上都具体维、哈、柯文的特色,完全符合用户的使用习惯,实现了维汉文混合排版、维文字符自动选型、从右向左书写等功能。32006 年底,上海中标软件有限公司(中标软件)面向广大藏文使用者推出了中标普华 Office3.0 藏文版软件产品。作为世界首款专门面向藏文使用者的办公软件一经推出即受到了相关地区以及人士的密切关注。该产品目前已经在上海、四川、浙江等地区的藏文学校、藏文相关机构中得到推广。中标普华 Office3.0 藏文版在符合藏文排版习惯的同时,提供了众多针对藏文的特色

5、功能:如:藏文断字、藏、中、英文自动混排、图片藏文自动混排等等,并提供了完整的符合国际及国家标准的藏文字库和输入法,能够在文字处理、电子表格、演示文稿、绘图制作等各方面轻松完成日常自动化办公任务,并且支持基于网络的协同化办公,能够广泛应用于西藏以及其他使用藏文地区的政府、教育、企业等各个领域中。实现了西藏中学的教育信息化,使民族文化与信息技术完美的结合起来,是一款根据中国民族特色定制的办公软件。针对维、 柯文独有的字符连笔、哈、 不等宽、右向输入、单一字符在词中不同位置不同形状等文字特点,中国工程院院士、新疆大学信息科学与工程学院教授吾守尔 斯拉木创造了维、 柯文、哈、 阿拉伯文变宽字符选形插

6、入连接、连笔字左右字符智能判断、智能组合连笔字复合字、光标不等宽管理等特殊技术和机制,使方块字处理技术发展成变宽连笔字处理技术,进行升级优化,并在全4疆及部分中亚国家推广应用,其技术达国际先进水平,属国内首创。该成果获 1993 年国家科技进步三等奖。此后,他先后又有科研成果获 2001 年国家科技进步二等奖、2010年自治区科技进步一等奖等。吾守尔斯拉木和他的科研团队从民族语言理论和特色出发,与现代信息技术完美结合,先后开发出 30 多种具有自主知识产权的 Dos 系列、Windows 系列、Linux 系列操作系统的维、 柯、哈、 阿多语种版本及排版印刷、办公自动化、信息通信等应用软件,并

7、广泛应用于科技文化教育、信息通信、新闻出版、广播电视、电子政务和商务、农业数字化等领域。近年来,为攻克多语种信息急需的一系列多媒体化、网络化关键技术,为新疆信息化保驾护航,吾守尔斯拉木和团队创立了维、哈、柯文的在线显示处理和 IME 技术,解决了卫星模式或互联网模式播发系统不支持维、哈、柯声图文混合文件的传输接收展示的难题;研发了多语言多媒体远程教学平台和智能双语教学系统,解决了边远地区双语教育资源匮乏问题;创立了民文信息的双向陷阱式屏幕取词与动态翻译、代码转换、跨平台等技术,解决了不需安装民文软件亦能正常浏览网站信息的难题;此外,他们还研发出了维、哈、柯文电台文稿网络系统、公文传输配套系统。

8、5这些技术实现了无纸化、网络化办公,解决了新疆各族人民乃至中西亚地区的各族侨胞直接用母语获取网络信息的难题,目前已普遍应用于网、天山网等大型门户网站。此外,吾守尔斯拉木带领团队研发了基于网络及通信设备的信息智能监控及舆情分析平台、大词汇连续语音识别与合成、文字识别、智能校对、智能搜索引擎等系统,为新疆乃至中西亚地区社会维稳、反恐防恐提供了智能技术支撑。而吾守尔斯拉木也因此获得 2007 年自治区科技进步奖特等奖。早在上世纪九十年代,中国民族信息技术研究院院长于洪志教授及其团队就做到了电脑文字识别功能,如一篇少数民族文字,只要在扫描仪上一扫,就变成可编辑文本。她带领课题组研制出了世界上第一个藏文

9、视窗平台、第一个藏文字处理软件,还建立了世界上第一个藏文网站。近几年,她正在率团研发少数民族语言的机器翻译,如一篇藏文,通过一个按键命令就变成汉字或英文。正在研发的还有少数民族语音合成,如一篇藏族文字输入电脑中,电脑可以就此朗诵出来,而且朗诵没有“ 机器味儿” ,有着人类自然的表达效果;少数民族语音识别,如只要录入所说的话,计算机将其自动生成为文字。现在全球计算机技术发展迅猛,只要一落后,目前已6开发的所有软件都会被淘汰。于洪志教授及其团队也在紧跟最先进技术,如云计算和大数据处理等。目前,义务教育、成人教育、科普教育等少数民族语言文字远程教育课件,已通过于洪志团队研制的云平台对外发布。其中“藏

10、语远程教育网”,自 2012 年 9 月运行以来,点击率超过 30 万,超过 80%的用户来自北京及西藏、青海、甘肃、四川、云南等藏族地区。藏文、蒙文、朝鲜文的数字图书馆也相继成立。此外的研发成果还有藏文、蒙古文、维吾尔文、朝鲜文古籍保护系统等。我国是统一的多民族国家,但直到 21 世纪初,与拉丁文、汉字相比,蒙古、藏、维吾尔、哈萨克、柯尔克孜等民族文字的识别研究几近空白,严重影响了文化信息化的发展。少数民族文字信息化,最基础的工作是信息的“输入” 。输入,最常见的方式是人工用键盘输入。可面对浩如烟海的图书与典籍,要把这些优秀的少数民族文化逐字逐句地手工输入计算机,简直是不可能完成的任务。这就

11、有了扫描。丁晓青与她的团队清华大学电子工程系智能图文信息处理研究室的师生们,最先挑战了汉字。1989 年,丁晓青研究组采用图像识别的方法,让计算机通过图像来进行“全局性” 认字,化零为整,错误率反而降低了,高效且实用。利用图像识别的方法同样识别了其他文字,如认英文、日7文、韩文等。理论上,图像识别的方法适用于所有文字。应该说,这找到了解决计算机识字的普适性方法。针对少数民族文字识别,丁晓青选择最重要、最具代表性的蒙藏维哈柯文字为突破口。清华大学丁晓青于 1999 年开始藏文识别研究,与合作单位西北民族大学在 2003 年完成了藏文(混排汉英)文档识别系统;于 2002 年开始了维吾尔文、哈萨克

12、文、柯尔克孜文以及阿拉伯文识别研究,与合作单位新疆大学在 2004 年完成了印刷体维吾尔文、哈萨克文、柯尔克孜文、阿拉伯文(混排汉英)文档识别系统;于2005 年开始蒙古文识别的研究,与合作单位内蒙古大学、内蒙古师范大学在 2007 年完成了多体蒙古文(混排汉英)印刷文档识别系统。通过对实际文档的识别性能的测试表明,系统对各种文字单字识别率均达 99%以上,实际民族文字(含汉英混排)文档识别率达 97%,均处于世界领先水平。在该技术上推出的“蒙藏维哈柯朝主要民族文字汉英混排文档综合识别跨文种理解系统”,为促进中华各民族文化信息化及交流提供了重要的数字化工具,并广泛应用于多种领域。譬如,国务院直

13、属负责对外宣传的中国西藏信息中心等单位网站、中国民族文化宫“民族数字图书馆” 对少数民族历史资源的抢救和信息化等。虽然多民族文字识别取得了突出成果,但仅仅是一个8开始,在丁晓青看来,民族文字信息化还有大量的工作需要去做。丁晓青和她的团队现今正在做少数民族文字的“识别理解”工作, “例如,可以将藏文文档经过识别,变成计算机可以阅读的文档,这样就有可能利用字典查询等工具,将其内容转换为汉字加以理解,或反之,将汉文档转换为藏文档或蒙文档表示。我们把这称为跨文种识别理解,是通过文档识别及机器跨文种理解等智能信息手段,实现文字查字典的功能。 ”实现各不同文种的民族语言及文档信息之间的的文种转换,使民族文

14、字语言真正实现沟通无极限还需要进行大量如 机器翻译等的研究开发工作。这对推动民族信息化,促进无障碍的民族文化交流,对维护国家统一和民族团结也是具有重要战略意义的。2、存在问题(一)现有的民族文化信息大多数是“资料保存库”,没有发挥其传播效用和真正实现信息分享,形成“信息共享数据库”。随着社会的发展和科技的进步,传统的民族民间歌舞、民族服饰、民族风情及其习俗传承机制等单一民族的特性非物质文化遗产正在日益消失,便捷直观的了解民族文化已成为一种趋势。(二)民族地区的文化事业和文化产业还有待于加强。目前还没有真正把民族民间文化的丰富底蕴,通过文化产9业表现出来,充分发挥其民族民间文化资源的优势和核心竞

15、争力。(三)民族地区文化人才匮乏制约了基层文化信息化的发展。长期以来,由于体制和政策导向及文化企业自身问题,很多能人没能安排到文化行业工作,优秀的人才更是“ 招不来、养不了、留不住” 。民族地区通过考试出去的精英基本上外出后不再回乡工作,造成专业人才资源的短缺。(四) 基层文化信息化资源缺乏整合,信息共享体系不健全。目前一些部门都在加强信息化建设,但大多只是重视硬件建设,忽视了软件建设,信息的采集和资源的开发各自为战,缺乏统一标准,重复建设,造成信息资源的浪费和闲置。(五)信息化对传统优秀民族文化产生不可避免的冲击 。 “电视进入一个村子是一次不可逾越的改变,族群的传说消失,族群集体记忆被电视

16、代替,在世界中的定位发生改变。 ”以手机为代表的新兴媒介进入少数民族地区更是一次巨大的变革。信息化使得少数民族地区外来文化加速进入,造成族群传说的消失,族群集体记忆被新的媒介和文化所代替,这也是近年来许多专家学者痛心的问题:一些民族歌谣、曲艺、传说等开始失传;一些精湛的民族工艺和建筑开始衰微;一些灵验有效的民族医药失去了市场;10一些有利于培养人类美德的传统礼仪和习俗被逐渐废弃等等。历来中西文化的交流总是部分商人或者是传教士首先带着器物进入某一地区,当地人总是由观望变为接受,部分人尝到甜头之后该新鲜事物便在当地推而广之。在接受器物的同时也接受了这种文化,进化自己的文化或者是用自己的文化化外来文化。随之带来的是不同地区不同民族的交流空前扩大,各种现代传媒的传播速度和传播范围达至空前,各种传统文化受现代文化的冲击也都达到空前。比如,被誉为“东方女儿国 ”的泸沽湖在世纪初的时候还是“ 人间仙境” ,后来由于外来商人、游客等的不断进入,本土文化受

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号