基于云模型的快速信息粒化算法

上传人:jiups****uk12 文档编号:40863376 上传时间:2018-05-27 格式:PDF 页数:8 大小:462.10KB
返回 下载 相关 举报
基于云模型的快速信息粒化算法_第1页
第1页 / 共8页
基于云模型的快速信息粒化算法_第2页
第2页 / 共8页
基于云模型的快速信息粒化算法_第3页
第3页 / 共8页
基于云模型的快速信息粒化算法_第4页
第4页 / 共8页
基于云模型的快速信息粒化算法_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《基于云模型的快速信息粒化算法》由会员分享,可在线阅读,更多相关《基于云模型的快速信息粒化算法(8页珍藏版)》请在金锄头文库上搜索。

1、基于云模型的快速信息粒化算法代劲。何中市重庆大学计算机科学与技术学院,重庆,4 0 0 0 3 0E m a i l :d a i j i n ( q , c q u p t e d u , c n接要:信息粒化是粒计算的基本问题云模型从概念角度提出了云变换方法来对信息进行软划分,从而完成信息粒化过程然而该方法存在着复杂度高且依赖先验知识的缺点针对以上问题,构建了一种云模型下的快速信息粒化算法该算法不需要任何经验值,能根据数据分布特点自动进行信息粒子划分及概念提取,具有耗费时间少、粒子聚合程度高的特点算法在应用于文本特征提取中,在未对分类器进行调整的情况下。性能已经同比超过了最优分类结果6 个

2、百分点以上,充分说明了算法的高效性关键词:云模型;粒计算;信息粒;概念抽取中图法分类号:T P l 8AF a s tI n f o r m a t i o nG r a n u l a t i n gA l g o r i t h mB a s e do nC l o u dM o d e lD A IJ i n H EZ h o n g - s h iC o l l e g eo f C o m p u t e rS c i e n c eo f C h o n g q i n gU n i v e r s i t y , C h o n g q i n g , 4 0 0 0 3 0E

3、m a i l :d a i i i n c q u p t e d u c nA b s t r a c t :I n f o r m a t i o ng r a n u l a t i o ni st h ef u n d a m e n t a lp r o b l e mi ng r a n u l a rc o m p u t i n g F r o mt h ev i e wo fc o n c e p t ,t h ec l o u dt r a n s f o r mm e t h o di sp r o p o s e dt op a r t i t i o ni n f

4、o r m a t i o nb a s e do nc l o u dm o d e l H o w e v e r , t h e r ei sah i g hd e g r e eo fc o m p l e x i t ya n dt h er e l i a n c eo nap r i o r ik n o w l e d g eu s i n gt h em e t h o d T os o l v et h ea b o v ep r o b l e m s ,af a s ti n f o r m a t i o ng r a n u l a t i n ga l g o r

5、 i t h mi sp r o p o s e da f t e rc a r e f u la n a l y s i so ft h ee x i s t i n gm e t h o d s B a s e do nt h ec h a r a c t e r i s t i c so fd a t ad i s t r i b u t i o n , t h ea l g o r i t h mC a l lp a r t i t i o ni n f o r m a t i o ng r a n u l e sa n de x t r a c tc o n c e p ta u t

6、 o m a t i c a l l yw i t h o u ta n ye x p e r i e n c e I th a sl e s st i m e c o n s u m i n ga n dh i g h e rd e g r e eo fp o l y m e r i z a t i o n T h ea l g o r i t h mi sa p p l i e dt ot h ee x p e r i m e n t so ft e x tf e a t u r es e l e c t i o n I nt h ec a s eo fn oa n ya d j u s

7、t m e n tt ot h ec l a s s i f i e r ,t h ep e r f o r m a n c eu s i n gi th a se x c e e d e dt h eo p t i m a lp e r f o r m a n c es i xp e r c e n t a g e so nt h es a m ec o r p u s K e y w o r d s :c l o u dm o d e l ;g r a n u l a rc o m p u t i n g ;i n f o r m a t i o ng r a n u l e s ;c o

8、 n c e p te x t r a c t i o n1 前言粒计算【l l ( G r a n u t a rC o m p u t i n g ) 是基于问题概念空间划分的智能计算理论方法,是复杂问 题求解、海量数据挖掘、模糊信息处理的有效工具,在国际上逐步得到了人工智能研究人员的高度重视1 2 3 】从不同粒度处理事物的能力出发,研究人员建立了各种粒计算模型最主要的有商空间模型【“ 】、词计算模型7 1 、粗糙集模型【8 】商空间模型通过对论域进行划分,研究不同粒度世界之间的互相转换、依存关系但是,商空间理论在实现粒度与粒度之间、粒度与粒度世界之间、粒度世界与粒度世界之间的转换方法上

9、,效率还需进一步提高词计算用词语代替数进行计算及推理,模糊逻辑在词计算中起中心作用,但必须和其他理论体系相结合。才能更有效地处理复杂信息粗糙集模型利用不可分辨关系( 等价关系) 来建立论域的一个划分,从而建立由不同大小概念粒形成的近似空间而这种等价关系是建立在精确的属性相等的条件下,对知识系统的不确定性、随机性缺乏描述能力为了增强对不确定、不精确性知识的处理能力,研究人员将模糊理论引入粒计算模型p 1 0 1 但当前的模糊理论还存在不彻底性:首先,作为模糊理论基石的隶属函数概念的实质以及具体肇金项I :I :国家8 6 3 i t 划砌f 1 ( 2 0 0 7 A A 0 1 2 4 2 3

10、 ) ,重庆市自然科学基金项【 ( 2 0 0 7 B B 2 1 3 4 ) 作者简介:代劲( 1 9 7 8 一) 男瞎l :研究生 要研究方向:智能信息处理、自然语言处_ l l l ! :何巾市( 1 9 6 5 一) ,男,教授博学,拦要研究 方向:模式识剐、机器学习1 7确定方法始终没有给出清晰解释;其次,隶属函数一旦通过人为假定“硬化”成精确数值表达后,就不再有丝毫的模糊性【1 1 1 针对存在的这些阿题,文献【1 2 1 5 1 在传统模糊数学和概率统计的基础上,提出了云模型理论云模型不需要先验知识,它可以从大量的原始数据中分析其统计规律,实现从定量值向定性概念的转化由于其具有

11、良好的数学性质,可以表示自然科学、社会科学中大量的不确定现剩1 2 J 从概念角度出发,云模型提出了通过云变换方法来对信息进行软划分,从而完成信息粒化过程然而该方法存在着复杂度高、依赖先验知识的缺点在仔细分析现有概念提取方法的基础上,本文提出了一种基于数据分布特点的快速信息粒化算法该算法不需要任何经验值,能根据数据分布特点自动进行信息粒子划分,将原有概念提取时间复杂度从O ( n 2 1 降至O ( k 2 功( 七为粒子集数) 算法同时具有较强的普适性,在应用于文本特征提取中,性能较目前的特征选择方法有了明显提高,充分说明了算法的高效性2 信息粒度原理粒度引申自物理学概念,意指微粒大小的平均

12、度量,在人工智能领域则被借用作为信息粗细的平均度量物理粒度涉及对物理对象的细化划分,而信息粒度则是对信息和知识细化的不同层次的度量1 4 - 5 粒计算的本质即通过合适粒度的选择,从而降低求解问题的复杂度人类智能的一个公认特点,那就是在认知和处理现实世界的问题时,常常采用从不同层次观察问题的策略,往往从极不相同的粒度上观察和分析同一问题,因此有必要研究不同粒度世界之间的关系设R 表示由x 上一切等价关系所组成的集合,可以如下定义等价关系:定义1 【4 】设R ,足R ,如果对于任意的工,Y X ,都有蛾y j 姐:弘那么就称R 比足细,记为墨恐定义1 说明了粒度的“粗”和“细”概念,可以证明以

13、下定理:定理1 【4 】尺在如上定义的“”关系下形成一个完备半序格,定理l 深刻的揭示了有关粒度的核心性质,根据此定理,可以得到如下序列:心sR 一。墨R 直观地看,如上操作得到的序列和一棵,7 层的树是相对应的设丁是一棵力层的树,所有叶 节点构成集合置那么每一层节点都对应着肭一个划分而聚类操作得到的聚类谱系图恰好也是一棵n 层树,因此必定存在一个等价关系序列与之对应,充分说明聚类和粒度间具有良好的相通特性,为快速信息粒化算法的提出奠定了理论基础3 云模型理论云模型是李德毅院士提出的一种定性定量转换模型”,用语言值表示某个定性概念与其定量表示之间的不确定性,已经在智能控制、模糊评测等多个领域得

14、到应用 定义2 【”】设绳一个普通集合X = 工 ,称为论域关于论域胂的模糊集合A ,是指对 于任意元素x 都存在一个有稳定倾向的随机数彳( x ) ,叫触对彳的隶属度 定义3 0 1 】设幄一个用数值表示的定量论域,C 是吐定性概念,若定量值X U 是定性概念c 的一次随机实现,工对C 的确定度4 x ) 【0 ,1 】是有稳定倾向的随机数,:U 专【0 ,l 】V x Ux 一( 工) ,贝, l J x 在论域u _ l z 的分布称为云,记为云c ) 每一仰称为一个云滴”L , I 如果概念对应的论域是盯维空间,那么可以拓展至门维云隶属度在基础变量上的分布称为云在对模糊集的处理过程中,

15、论域中某一点到它的隶属度之间的映射是一对多的转换,不是一条明晰的隶属曲线,从而产生了云的概念在云模型1 8中,经过映射,属于一个定性语言值的数值是不确定的,而是始终在细微变化着,并且这种变化不剧烈影响到云的整个特征云可伸缩、无边沿、有弹性,云滴的分布特性反映了映射的模糊性和随机性,其整体形状是最重要的4 基于云模型的快速信息粒化算法4 1 云模型下的概念粒子自然语言中的最小单位是语言值,表示为语言值的概念是思维的基本细胞,概念比数据更确切、更具备普遍性从概念的外延特性来看,概念可分为精确概念和不精确概念( 定性概念、模糊概念) 其中,不精确概念的外延是不确定的、模糊的,它涉及到两种不确定性:其

16、一是随机性,例如人们对年龄为3 5 岁的人是属于青年还是中年的一次回答是随机的:其二是模糊性,例如一个人或一个社会团体对青年这一概念的描述是模糊的,没有明确边界人们通常用定性语言值来描述不精确概念,例如“天气不错”、“性能可靠”等等文献 1 2 1 在传统模糊数学和概率统计的基础上提出了云模型理论,用来刻画定性和定量彼此间相互联系、相互依存、性中有量、量中有性的映射关系用尽量接近“自然”的方法完成定性和定量之间的转换,很好的反映了两者之间的不确定性与随机性而这些定性概念集,正是具有某种相同特性的等价关系的数据划分,构成了云模型下的信息粒子空间云用期望E x ( e x p e c t e dv a l u e ) 、熵E n ( e n t r o p y ) 、超熵H e ( h y p e re n t r o p y ) 这3 个数字特征来整体表征一个概念,记作A (

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号