巧妙解决维吾尔文排序的方法

上传人:w****i 文档编号:110737807 上传时间:2019-10-31 格式:PDF 页数:4 大小:137.23KB
返回 下载 相关 举报
巧妙解决维吾尔文排序的方法_第1页
第1页 / 共4页
巧妙解决维吾尔文排序的方法_第2页
第2页 / 共4页
巧妙解决维吾尔文排序的方法_第3页
第3页 / 共4页
巧妙解决维吾尔文排序的方法_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《巧妙解决维吾尔文排序的方法》由会员分享,可在线阅读,更多相关《巧妙解决维吾尔文排序的方法(4页珍藏版)》请在金锄头文库上搜索。

1、第4 8 分会场学术沙龙以科学发展观推动科技的创新 5 1 5 差为图上0 5 t a r a ,即02 5 m ,因此,纠正后影像上单点定位的绝对误差为: 7 Y l2 = 、j i 啊= 、,i j i j j 7 = j 厨= 0 9 0 3 m ( 4 ) 这项精度指标完全达到了l :2 0 0 0 地形图图上单点定位绝对精度的要求( 10 m ) ,这表明采用 Q u i 。kB i r d 分辨率为06 1 m 的全色影像在地形起伏不明显的城区大范围内完全可以对1 :2 0 0 0 的大比 例尺地形图进行更新。 需要指出的是,以上所选实验区尽管范围大,可形起伏不明显,l x l d

2、 :达到了更新1 :2 0 0 0 大比例尺地 形图的精度要求。至于地形起伏很大的山区,利用Q u i c kB i r d 高分辨率全色影像更新地形图究竟能达 到多大的精度,还需要进一步实验给出。 褒4 不同模式下( h i c kB i r d 影像纠正精度比较 ( 单位:像素) 作者简介王宪伦,辽宁省第三测绘院航摄室主任,工程师。从事航空摄影与遥感十余年,主要研 究方向为航空摄影自动化设计、遥感影像分析与处理、利用遥感影像进行地形图自动化更新。电话: 0 2 4 8 6 5 8 6 3 0 0 ,手机:1 3 0 6 6 5 2 5 3 5 0 ,传真:0 2 4 8 6 5 8 6 3

3、 0 1 。 巧妙解决维吾尔文排序的方法 吐尔根- 依布拉音艾尼瓦尔麦麦提 新疆大学信息科学与工程学院,乌鲁木齐,8 3 0 0 4 6 撼要奉文提出了一赞蹿雏吾尔文进行排序的方法。该方法通过代码转换,对不羁代 码标准的维吾尔文进行快速排序。谊方法在大型数据库应用系统中有较高的实用价值。 关键词自然语言处理维吾尔文排序代码转换 引言 目前用计算机处理维吾尔文工作的一项重要内容是实现维吾尔文自动排序功能。由于目前正在使 用的信息处理用维吾尔文代码不统一,到目前为止,从各类排版系统到W i n d o w s 操作系统,或其他数据 库系统,都没有提供维吾尔文排序功能。这使得维吾尔文印刷排版需要人工

4、排序。数据库应用中。问题 更严重。快速查询需要对数据库记录进行排序,所有的数据库系统提供的排序功能对维吾尔文排序时, 按照维吾尔文字母的代码先后顺序进行排序,而不是按照维吾尔文字母表顺序。虽然从计算机的角度 解决r 排序问题,但从用户角度看根本没有进行排序。U n i c o d e 支持维吾尔文以后,大型维吾尔文数据 库应用系统越来越多,这使维吾尔文排序问题显得更为重要。目前在信息处理用维吾尔文代码还没有 本文得到国家自然科学基金项目支持。编号为6 0 2 6 3 0 0 4 5 1 6以科学发展观促进科技创新【中) 完全统一的情况下,有没有一个通用的维吾尔文排序方法可用? 维吾尔文排序到底

5、怎么解决才好? 本 文试从这两方面进行探讨。 一、维吾尔文排序的分析及解决的思路 在D O S 时代。D O S 操作系统提供了一个外部命令S O R T ,实现了英文文本文件的排序。目前的各 类数据库系统和M i c r o s o f tW o r d 、E x c e l 等各种应用软件都提供了排序功能。不管是W i n d o w s 操作系 统,还是各类数据库系统或其他应用系统排序时都不是按字符代码进行排序的,而是有一定的排序实现 机制。最简单的例子就是。排序功能可以把大写A 和小写a 放在Z ,z 的前面,而字符a 的代码大于字符 z 的代码。很容易发现各类软件系统在排序时,都使用

6、了专门的排序模块,而不是单纯的按照字符代码 的顺序进行排序的。在支持U n i c o d e 的系统中,对维吾尔文进行排序时,系统按阿拉伯文字母表顺序进 行排序,这也不符合维吾尔文字母表的顺序。针对以上问题,我们提出了一种解决方法并进行测试。测 试结果表明,该方法使用方便,不需要大量的编程,通过调用系统提供的排序功能,可实现维吾尔文自动 排序。 首先我们分析维吾尔文字母表。维吾尔文是由3 2 个字母组成的黏着型拼音文字。每个字母在词 首、首中、词尾和独立时有不同的代码和形状。在排序时,字母的不同代码和不同形状需要统一处理。 但所有的元音字母在词中出现时有带“A m z e ”( 一种特殊的分

7、音节符号) 和不带“A m z e ”的两种情况,这 时虽然是同一字母,需要分别处理。只要解决了这些问题,纯维吾尔文的排序就可以解决了。我们设计 了一个维吾尔文字母表与A S c I I 码表的对应表。每个维吾尔文字母按照其在字母表中的顺序对应于 一个A S C I I 字符。对纯维吾尔文进行排序时,对维吾尔文根据对应表进行转换后,直接调用系统排序 功能进行排序。排序完成后可以再把生成的排序文档转换成维吾尔文文档。在数据库应用系统中可以 采取更灵活的方法,即增加一个字段保存维吾尔文查询关键词的对应代码,排序、索引时直接用对应代 码。而不用原查询代码进行排序和索引,这样就很容易实现维吾尔文的排序

8、和索引。实现的维吾尔文排 序,因为调用了系统的排序功能,排序效率非常高。图1 是目前最流行的维吾尔文排版系统代码和标准 U N l C O D E 中维吾尔文代码与A S C I I 字符对应表。 序号字母 国际音标排序代码键盘辕A 代码序号字母国际音标 排牟代码键盘输人代码 A S C I IA S C l l 4 P D P 2 l 1UI 5tE t2 2mvm 6一d3F J2 3nWn 7 t G q2 4一hXa 8 xHH2 5 oY o 9dI d2 6uZu l Or Jr2 7 6aK 1 I zK z2 8 Y bv 1 2 3 L D2 9 w cw 1 3sM 83

9、0ed e 1 4 f N x3 1 一 ie h 1 5 g h O c3 2fv 1 6 一fPF 3 3 a m z e m g 一! ! !壁 j兰!堕 ! ! 圉1 维吾尔文字母表与排序A S C I I 字符对应表 k G R S T k g 日 一 8 9 01 f g b A B Ca 把b一 2 3 第4 8 舟舍场 学术沙龙以科学发展观推动科技的创新 5 1 7 二、排序的实现 图1 给出了维吾尔文字母表与A S C I I 排序字符的对应关系。有了这个对应关系,就可以实现维吾 尔文排序了。具体实现方法如下。 1 对维番尔文文本的排序 对维吾尔文文本文件进行排序时,需要在排

10、序过程中对排序关键词进行动态转换再用系统提供的 A S C I I 代码排序方法进行排序,排序完成后再根据对应表将结果转换为维吾尔文。排序过程只对关键 词进行转换而且转换过程很快。由于使用了系统本身提供的排序方法,排序效率很高。文本排序过程 不受不同维吾尔文代码标准的限制。用户在第一次使用之前设置自对应表给出扭应的维吾尔文字符后 就可以生成新代码的转换表。所以排序算法不受具体的维吾尔文代码的限制。为了实现维吾尔文本文 件的排序,我们提供了基于以上对应表的排序程序。程序可以对目前流行的几种维吾尔文代码标准的 文本文件进行排序。程序界面如图2 所示。程序对文本文件进行排序时,还可以设置文本文件中关

11、键 词的起始和终止符。实现只对关键词进行转换,使排序过程更快。 图2 维吾尔文排序程序界面 2 对数据库中记录的排序 在数据库系统中对维吾尔文关键词字段进行排序时,可以将动态转换关键词或增加一个排序字段 将维吾尔文美键词保存到该字段中,在排序时直接对排睁关键词进行排序即可。因为只需转换保存维 吾尔文排序关键词,所以也不会有太大的冗余。排序过程直接调用数据库系统的排序或索引功能所以 排序过程非常快。为了使用户将维吾尔文关键词转换成排序符号,我们设计了相应的维吾尔文排序关 键词转换程序源代码及相关的动态连接库( D L L ) 、A e t i v e X ( O C X ) 控件等。所以在具体的

12、数据库应用中 可以直接调用维吾尔文到排序A S C I I 表的转换程序实现排序,丽不需要增加代码,排序过程简单、迅 速。以下是转换过程的部分源代码。 F u n c t i o nB 0 2 S o r t ( B y V a lS o u r c e s t rA sS t r i n g ) A sS t r i n g C O n s tL e t t e r C o u n t = 3 4 * 4 十2 D i mS t r L e nA sI n t e g e r D i mp S t r l ,p S t r 2A sS t r i n g 5 1 8 以科学发展观促进科技剖新

13、( 中) D i mi ,J kA sI n t e g e r S t r L e n = L e n ( S o u r c e S t r ) D i mp S t r l p S t r 2A sS t r i n g D i mi ,j ,k A sI n t e g e r S t r L e n = L e n ( S o u r c e S t r ) C a l lI n l t A r r a y ( ) 初始化维吾尔文一排序A S C I I 对应表 F o ri=1T oS t r L e n p S t r l = M i d ( S o u r c e S t r

14、,j ,1 ) F o ri=1T o3 4 I f ( U i g h u r s ( i ,O ) = p S t r l ) T h e nE x i tF o r I f ( U i g h u r s ( ;,1 ) = p S t r l ) T h e nE x i tF o r I f ( U i g h u r s ( i ,2 ) = p S t r l ) T h e nE x i tF o r I f ( U i g h u r s ( i 。3 ) = p S t r l ) T h e nE x i tF o r N e x t i I f ( j 3 3 ) T

15、h e n p S t r 2 = p S t r 2 + U i g h u r s ( i ,5 ) C h r ( A s c ( “) + i 一1 ) 3 3 不用转换3 3 是A m z e E l s e l f i = 3 4T h e n p S t r 2 = p S t r 2 + U K E n dI f N e x t j B 0 2 S o r t = p S t r 2 E n dF u n c t i o n 三、结论 本文针对目前没有任何维吾尔文文本和数据库排序软件的问题,设计维吾尔文代码到排序用 A S C l l 的对应表,实现了对维吾尔文文本及数据库的排序。同时本论文提供了排序软件及动态连接库 等,提供了维吾尔文排序工具。目前该方法烈用于关键词为纯维吾尔文的排序,多语言混合的关键词排 序方法有待于进一步讨论和研究。 参考文献 1 杨大顺,琦明华,王伟,顾芸瑛一种新的外排序方法计算机研究与发展,1 9 9 4 ,( 1 0 ) 2 孟令奎,金先级,张江陵一种新的并行排序算法研究华中理I 大学学报,1 9 9 4 ,( 6 ) 3 来智勇并行归并排序算法计算机研究与发展,1 9 9 5 ,( 6 ) 作者简介吐尔根依布拉音,教授,主要研究方向为自然语言处理。E m a i l :! ! 垡坚鱼型! :! 些:

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号