生成语义网络的分层可视化的制作方法

上传人:ting****789 文档编号:310018189 上传时间:2022-06-14 格式:DOCX 页数:6 大小:23.10KB
返回 下载 相关 举报
生成语义网络的分层可视化的制作方法_第1页
第1页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《生成语义网络的分层可视化的制作方法》由会员分享,可在线阅读,更多相关《生成语义网络的分层可视化的制作方法(6页珍藏版)》请在金锄头文库上搜索。

1、生成语义网络的分层可视化的制作方法专利名称:生成语义网络的分层可视化的制作方法技术领域:本发明涉及数据处理技术,特别涉及利用计算机对语义网络进行分层可视化处理的技术。背景技术: 语义网络(semantic network)是在人工智能和知识工程中使用的一种重要知识表示方法,被广泛地用来定义和描述领域知识。一般语义网络由结点和弧(连接)组成,其中节点表示事件和概念,而弧表示节点之间的关系。图1A示出了一个可视化的语义网络的例子,在其中包括多个概念(由图中的三角形、正方形、五边形和多边形等节点表示),以及概念之间的连接(由图中的连线表示)。语义网络具有以下的优点1,有较强的表达能力,它可以表示谓词

2、逻辑中的二元关系,并且如果将多元关系转换为二元关系,也可以用语义网络表示;2,语义网络对于知识的表示具有直观、清晰的特点,而且程序可以对它的直接搜索、操纵其中的数据。目前,语义网络已被广泛用于基于知识的计算机系统中,例如,企业组织结构管理、智能搜索引擎、和专家系统等。但是,由于显示器屏幕的限制,语义网络中的内容量可能会超过一个屏幕可以清晰显示的范围。以往通过将显示的图像、文字缩小到可以在一屏中容纳下,然后再根据用户的选择区域进行放大截取,来处理这种情况。但是,这样在缩小显示时,由于无法看清显示的文字,因此不便于操作。而且,由于对于重要的和不重要的概念或者关系,一起同比例的缩小,用户很难挑选希望

3、的内容进行逐级的和渐进的浏览。发明内容为了解决以上描述的现有技术中的问题,根据本发明的一个方面,提供了一种生成语义网络的可视化层次结构(hierarchy model)的方法,所述语义网络包括多个概念和多个用于连接两个概念之间的关系实例,所述方法包括根据所述语义网络中所述多个概念的连接关系,确定所述概念之间的相似性;以及将相似性高的概念逐一合并,从而形成所述语义网络的可视化层次结构。根据本发明的另一个方面,提供了一种浏览语义网络的方法,所述方法包括利用前面所述生成语义网络的可视化层次结构的方法,生成所述语义网络的可视化层次结构;根据用户的选择,显示所述语义网络的可视化的层次结构的相应层次描述的

4、内容。根据本发明的另一个方面,提供了一种生成语义网络的可视化层次结构的装置,所述语义网络包括多个概念和多个用于连接两个概念之间的关系实例,所述装置包括概念相似性计算单元,用于根据所述语义网络中所述多个概念的连接关系,确定所述概念之间的相似性;概念合并单元,用于将相似性高的概念合并;层次形成单元,用于通过概念合并单元逐级地形成所述语义网络的可视化层次结构。根据本发明的另一个方面,提供了一种语义网络的浏览器,所述语义网络包括多个概念和多个用于连接两个概念之间的关系实例,其特征在于,所述浏览器包括前面所述的生成语义网络的可视化层次结构的装置;图形转换单元,用于将由所述生成语义网络的可视化层次结构的装

5、置生成的可视化层次结构转换为图形方式进行显示;层次切换单元,用于根据用户的选择,切换所述层次结构的各个层次描述并控制所述图形转换单元进行显示。相信通过以下结合附图对本发明具体实施方式的说明,能够使人们更好地了解本发明上述的特点、优点和目的。图1A展示了一个可视化的语义网络的例子,图1B和1C展示了根据本发明的一个实施例的生成语义网络的可视化层次结构的方法生成的语义网络可视化层次结构(hierarchy model)各层次描述的例子;图2是根据本发明的一个实施例的生成语义网络的可视化层次结构的方法的流程图;图3是根据本发明的一个实施例的浏览语义网络的方法的流程图;图4是展示根据本发明的一个实施例

6、的生成语义网络的可视化层次结构的装置的方块图;以及图5是展示根据本发明的一个实施例的语义网络浏览器的方块图。具体实施例方式下面就结合附图对本发明的各个优选实施例进行详细的说明。生成语义网络的可视化层次结构的方法本发明提供了一种生成语义网络的可视化层次结构的方法。为了更好地理解本申请,在描述本发明的实施例之前,首先对于其中用到的一些术语进行说明。概念集合(concept set)是一个语义集合Cc1,.,cn,其中C中的每个元素是一个特定的语义对象,被称作概念或概念项目,例如,概念集合的元素可以是人名、地名等等。关系集合(relation set)关系集合Rr1,.,rm的每个元素是一个特定的谓

7、词(关系类型)以确定两个概念项目之间的语义连接,被称作关系项目或关系类型,例如,关系集合的元素的例子可以是“上下级关系”、“夫妻关系”等等。三元组(triple)一个三元组t(subject,predicate,object,w),其中subject,objectC,predicateR,可以被看作一个两边各有一个节点的有方向的链接,每一个由三元组体现的连接可以被看作是关系集合中相应关系类型的一个关系实例。其中,w是“定义权重”代表相应三元组的重要性或者可靠性,是在建立语义网络时,由用户输入的或者通过计算得到的,在本实施例中,w取值为0到1之间。语义网络(semantic network)由三

8、元组的集合构成,St1,.,tk。由于每个三元组可以被看作在两端具有两个节点的一个有向连接,并且多个三元组可以共用一个相同的概念项目,因此基于一个三元组集合,可以生成一个有向图(directed graph),被称作语义网络。相邻概念集合(Neighbor concept set)由语义网络S中所有与c相关联的概念组成的集合。对于一个给定的概念项目c,其相邻概念集合为NC(c)=nc1,.,ncm|i≠j⇒nci≠ncj,∀nci⇒&am

9、p;Exists;t∈S,(subject(t)nciobject(t)c)(subject(t)cobject(t)nci)true)相邻概念向量(neighbor concept vector)是表示一个概念c与所述语义网络中的其它概念的连接关系的向量。如果概念集合中有N个概念项目,将概念集合中的每个概念项目作为N维向量空间中的一个分量,则根据本发明的一个实施例,可以按照以下原则计算N维相邻概念向量v(c)对于v(c)的一个分量,如果其对应的概念项目与c具有连接,即,在这两个概念之间存在一个三元组,则使用对应的三元组的权重作为该维的值;如果在这两个概念之间存在多个三

10、元组,则取这些三元组中最大权重作为该维的值;如果在这两个概念之间没有三元组,则将该维的值设为0。进而,当三元组中没有包含权重时,也可以是,如果在这两个概念之间存在三元组,则将该维的值设为1或者是三元组的个数;如果在这两个概念之间没有三元组,则将该维的值设为0。关系类型特征向量(feature vector of relation type),是表示一个关系类型r在一个语义网络中的特征的向量。如果该语义网络包含N个概念,则一个关系类型特征向量v(r)是一个2*N维向量v(r)ws1,ws2,.,wsN,wo1,wo2,.woN。前面N个分量与各个概念作为该关系类型r的所有关系实例的主语(subj

11、ect)的情况对应,后面N个分量与各个概念作为该关系类型r的所有关系实例的宾语(object)的情况对应。根据本发明的一个实施例,每个分量的值可以利用词频(term-frequency)来计算,即,对应的概念在语义网络中作为关系类型r的主语或宾语出现的次数。图2是根据本发明的一个实施例的生成语义网络的可视化层次结构的方法的流程图。如图2所示,首先步骤201,根据语义网络中概念的连接关系确定概念之间的相似性。具体地,为每个概念计算相邻概念向量v(c),并根据计算出的相邻概念向量确定概念之间的相似性。在本说明书中后附的伪代码片段1示例性地展示了根据两个概念项目的相邻概念向量v(c1)、v(c2)确

12、定相似性的算法。该算法中,先判断两个概念项目是否相邻,如果不相邻则返回0,如果相邻则返回两个向量之间夹角的余弦,cos(wi,wj)=wi·wj|wi|×|wj|.本发明并不限于代码片段1的算法,也可以利用其他方式来表示两个概念项目的相似性。接着在步骤205,将相似性高的概念逐一合并直到一个预定数量,作为可视化层次结构的一级。在本说明书中后附的伪代码片段2示例性地展示了根据相似性将概念项目逐一合并直到一个预定数量的算法。该算法中,首先取出语义网络中的全部三元组,然后利用前面计算相似性的方法找到相似性最高的概念对(a,b),其中a和b是属于一个三元

13、组的两个概念项目,接着创建一个新概念项目c,将a和b合并为c,并且将所有包含a或b的三元组更新,将a、b换为c。循环执行该合并过程,直到概念项目减少到一个预定的数量m。在此,预定数量m是层次结构中该级中希望保留的概念的数量,可以由用户指定或者由系统根据语义网络中概念和关系实例(或者三元组的数量)计算出来,后面将详细描述可视化层次结构的级数和每级合并时的预订数量m的计算方式。接着在步骤210,判断是否需要进行下一层的合并,如果需要则以刚刚合并得到的一层作为基础,返回继续进行相似性确定和合并(步骤201和205);如果判断为不需要进行下一层合并,则进行到步骤215,由通过合并得到的各级和原始语义网

14、络构成可视化层次结构。在本实施例中,可视化层次结构的级数和每个级中所包含的概念或者三元组(关系实例)的数量可以由用户按照自己的喜好来设定,或者预先设定为不同的模式由用户选择,也可以根据显示屏幕每屏可以显示的实体(概念项目节点和关系连接)的数量以及语义网络中概念项目和关系实例的数量自动地计算得出。例如,假设语义网络中包含N1个概念项目和N2个关系实例,并且一页屏幕可以显示M1个概念项目结点和M2个关系连接,则生成的可视化层次结构的级数k可以通过以下的公式来计算层次k满足M1+M12+···+M1k≤

15、N1M2+M22+···+M2k≤N2即,k=max(logM1(N1+1)(M1-1)+M1M1+1,logM2(N2+1)(M2-1)+M2M2+1)(式1)相应地,每一级的概念项目数量可以为mi=max(M1i,M2i),(i=1···k)(式2)当然,也可以以其它任何本领域技术人员可以想到的方法来计算层次结构的级数和各级包含的概念项目数量。采用以上描述的本实施例的方法,可以根据语义网络本身包含的特征信息为其

16、生成可视化层次结构。根据本发明的另一个实施例,在根据语义网络中概念的连接关系确定概念之间的相似性的步骤(图2的步骤201)之前,首先由用户提供感兴趣的关系类型作为主关系类型(primary relation type)。然后,根据语义网络中的每个关系类型与该主关系类型的相似性,为每个关系类型指定一个优先系数(ranking value)。在本说明书中后附的伪代码片段3示例性地展示了根据两个关系类型的关系类型特征向量v(r1)、v(r2)确定相似性的算法。然后,在根据语义网络中概念的连接关系确定概念之间的相似性的步骤中,更具体地,在为每个概念计算相邻概念向量v(c)时,将三元组的权重和优先系数的乘积作为每个分量的值,例如,对于v(c)的一个分量,如果其对应的概念项目与c具有连接,即,在这两个概念之间存在一个三元组,则使用对应的三元组的权重和该关系类

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号