大学计算机基础 - CCF

上传人:创****公 文档编号:136633361 上传时间:2020-06-30 格式:PPT 页数:23 大小:1.26MB
返回 下载 相关 举报
大学计算机基础 - CCF_第1页
第1页 / 共23页
大学计算机基础 - CCF_第2页
第2页 / 共23页
大学计算机基础 - CCF_第3页
第3页 / 共23页
大学计算机基础 - CCF_第4页
第4页 / 共23页
大学计算机基础 - CCF_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《大学计算机基础 - CCF》由会员分享,可在线阅读,更多相关《大学计算机基础 - CCF(23页珍藏版)》请在金锄头文库上搜索。

1、基于语义构件的甲骨文字库自动生成技术研究,报告人:吴琴霞 单 位:安阳师范学院 E-mail:wqx0218,2,1.问题的提出,2.甲骨字形构成分析,3.构件知识库的建立与应用,报告主要内容,4.甲骨字的构形系统,5.结论,3,一、课程剖析,1.问题的提出,研究意义,认读甲骨字,40%,数字化,计算机技术,出土甲骨片,10万片,甲骨学,2,4,甲骨文数字化的前提?,1.难以定形,难以输入。 2.字形复杂。(大量的异体字和合体字) 3.难以定量。(大量的未释字和新出土的甲骨字),甲骨文字库建立面临的难题,1.问题的提出,甲骨文字库的建立。,5,甲骨字表示成由415个语义构件和18个笔元作为操作

2、数,构件间的5种位置关系作为运算符的数学表达式,无字库的输入方式,方法的提出,该方法摆脱了字库的限制、存储量小; 方便了文字的跨平台的传播; 并且每个部件附加上对应的语义信息,为认知和考释甲骨文带来了方便。,该法达到的目的:,6,造字机理:,方法的可行性甲骨字构形分析,甲骨文多为合体字 ; 多为义义组合;,甲骨字的造字机理:,文字系统中字符的构成有具有一定的层次性和理据性 初造字字符在形成时没有参照文字系统中已有的字符 新造字字符在形成时参照了文字系统中已有的字符,7,方法的可行性甲骨字构形分析,甲骨字大多为基字之间通过某种组合规则相互组合获得新字符。这种符号联系性将所有字符都串起来,使得整个

3、字符系统中的字符变成一个有机整体 。,8,方法的可行性甲骨字构形分析,新造字符富有层次性,层次的增多,构件数量也逐渐增多,字符显得更加复杂 。,9,分层甲骨文字库,甲骨字表示为由几个构件和笔元构成。 一个甲骨字JGZ由若干个构件Ci(i=1,2,n)构成。每个构件由若干笔元构成SS i(i=1,2,n)构成,每个笔元由若干个笔段Bij构成。即: JGZ=C1,C2,Cn ;C i =SS1,SS2,SSn;SS i =(Xi1,Yi1)|( Xi2,Yi2);,笔元:笔元是由一个或多个有向笔段组成的一个完整的笔画结构,有向笔段:即有方向的线段,设(X1,Y1)是线段的起点, (X2,Y2)是线

4、段的终点,则一个完整的有向笔段的描述为: B12=(X1,Y1)|( X2,Y2),10,甲骨文的基本笔元,11,通过分析1024个甲骨字,提取415个具有独立语义单位的甲骨文构件。甲骨字是由构件和基本笔元组成,不同的组合和位置关系组成不同的甲骨字 。为实现甲骨字体的笔元分解,将所有的构件组成的规则有机组织起来,形成甲骨字构件知识库。,构件知识库:,构件知识库的建立,构件骨架的提取与保存:,构件在不同的甲骨字中所处的位置、大小不同,并且形状还可能发生稍微的变形。 构件库要保存的信息:笔元分界点、笔元间的组合关系、笔元数、构件语义。,12,构件的存储,13,构件外观动态修改,满足不同的甲骨字中构

5、件的外观不同,先对构件的骨架信息进行编辑和修改来满足不同的需要 。 构件修改算法见论文,主要包括笔元的插入、移动、删除、编辑等。依据算法可以生成不同的构件外观。,14,基于仿射变换的构件复用,仿射变换是在平面几何上的一种线性变换,可以将二维图形旋转、缩放、切变和投影等。所以仿射变换可以达到构件复用的功能 。 仿射变换的关键是在甲骨字和构件上选取3个对应点,3个点在变换后是与原甲骨字字形位置不变的,它完全决定了变化后的甲骨字构件的位置、大小和形状。选点不当会造成字形不理想 。,15,选点规律,1)直线笔元:可选开始节点的两个分叉点和末节点。两个分叉点决定笔元的宽度,末节点决定笔元的长度。 2)折

6、线笔元:可选开始节点、中间拐点和末节点。 3)弧线笔元:可选开始节点、中心点和末节点。 4)方形的构件: 选四个角中的三点。需要上部对齐则选上部左右两角和下部一点,需要下部对齐则相反。 5) 三角形的构件:一般选最上点和最下两点。但如果构件没有对正,则可适当在构件或甲骨字上向左或右偏移下面的某一点,直至对齐。 6) 在左边的构件:可选最上一点、最下一点和最左一点,在右边的偏旁则反之。,16,系统以甲骨文的笔元矢量图为基础的对象,经过特征提取整合等步骤后生成构件知识库,从而得到甲骨字的组成笔元之间的位置关系,产生甲骨字的构件描述。,甲骨文构形系统:,甲骨文构形系统,17,甲骨文的结构特征,甲骨字

7、的结构特征:,甲骨文字形拓扑图形中可以归纳出五大类基本结构:1)独体结构用“D“表示;2)左右结构,左右结构中又分为相接(LRj)和分离(LRf);3)上下结构,上下结构也分为相交(TBj)和分离(TBf);4)半包围结构(BBW);5)全包围结构(QBW)。,18,甲骨字描述,19,存储量减少,语义构件库中的每一个构件用特征点保存,现已经总结出415个语义构件,存储量为126KB,用500个甲骨字做实验。在存储甲骨字时只需给出构件名(即索引信息)3个字节,坐标参数就可以了。采用该方法组成的字库和使用Bezier曲线存储每一个甲骨字存储量对比如图4所示,20,21,构件笔元组成甲骨字,22,结束语,本文以已释的1024个甲骨字为研究对象,使用骨架信息的提取等基本操作,产生了甲骨字的笔元特征点,以完整的语义信息为基本构件,生成了甲骨字的构件知识库。最后通过仿射变换复用构件生成每个甲骨字形。采用此方法为以后的语义构件统计,甲骨字形形成,甲骨字的编码和甲骨字中未释字的考释打下基础。 虽然这种方法在运行时还有不少改进的地方,但通过这种方法可以实现甲骨字分级字库的建立,大大减少人工的工作量,使得字库的容量可以动态的增加和修改,并且存储量小方便传播。,23,结束语,Q&A? 谢谢大家!,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号