[doc]基于MLE的本征维数估计方法研究

上传人:jiups****uk12 文档编号:39448283 上传时间:2018-05-15 格式:PDF 页数:31 大小:956.95KB
返回 下载 相关 举报
[doc]基于MLE的本征维数估计方法研究_第1页
第1页 / 共31页
[doc]基于MLE的本征维数估计方法研究_第2页
第2页 / 共31页
[doc]基于MLE的本征维数估计方法研究_第3页
第3页 / 共31页
[doc]基于MLE的本征维数估计方法研究_第4页
第4页 / 共31页
[doc]基于MLE的本征维数估计方法研究_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《[doc]基于MLE的本征维数估计方法研究》由会员分享,可在线阅读,更多相关《[doc]基于MLE的本征维数估计方法研究(31页珍藏版)》请在金锄头文库上搜索。

1、3 二C 独创性声明本人郑重声明:所提交的学位论文是本人在导师指导下独立进行研究工作所取得的成果。据我所知,除了特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果。对本人的研究做出重要贡献的个人和集体,均已在文中作了明确的说明。本声明的法律结果由本人承担。学位论文作者签名:谨j 朱聋日期:2 型2 :! 学位论文使用授权书本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即:东北师范大学有权保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权东北师范大学可以采用影印、缩印或其它复制手段保存、汇编本学位论文。同意将本学位论文收

2、录到中国优秀博硕士学位论文全文数据库( 中国学术期刊( 光盘版) 电子杂志社) 、中国学位论文全文数据库( 中国科学技术信息研究所) 等数据库中,并以电子出版物形式出版发行和提供信息服务。( 保密的学位论文在解密后适用本授权书)学位论文作者签名:倡醢E t期:趔坌:4学位论文作者毕业后去向:工作单位:通讯地址:指导教师签名:日期:电话:邮编:摘要自上个世纪以来,随着计算机技术的飞速发展,人们可以更好的处理复杂数据,与此同时,高维数据分析技术也蓬勃发展。高维数据的本征维数估计问题研究,在高维数据处理领域中有着重要的地位。对于高维数据处理领域,本征维数的寻求具有重要的意义。在降维方法中,本征维数是

3、一个需要我们去估计的未知量,准确的估计出高维数据的本征维数,对接下来的降维处理问题有着重要的指导意义。并且,在数据处理过程中,准确的本征维数估计对选取合适的邻域大小有很大的帮助,可以避免“维数灾难”。本文提出一种新的方法一基于M L E 算法的本征维数估计算法。大多数情况下, 数据间的近邻关系能充分的反映数据的局部几何特征。M L E ( M a x i m u mL i k e l i h o o dE s t i m a t i o n ) 估计方法就是通过建立关于近邻间距离的似然函数,从而得到本征维数的估计值。传统的M L E 方法存在两点不足:一是对同一个邻域内的不同样本点所估计出的本

4、征维数值,只是简单的求均值作为该邻域的本征维数,受奇异值的干扰较大;二是在选取K 近邻时,采用传统的欧氏距离,容易出现越层现象。针对以上不足,本文采用邻域平滑( N e i g h b o r h o o dS m o o t h i n g ) 方法替代原来的均值方法,求出更加可靠的本征维数值;在选取K 近邻时,采用测地线距离代替欧氏距离,以找到真实的K 近邻点。本文在模拟数据库和真实数据库上对该方法进行了实现,通过实验证明了改进后算法的可行性和有效性,文章最后对算法的实验结果进行了分析,实验结果表明,这种新的方法是有效的,可以估计出更为可靠的本征维数值。关键字:本征维数;极大似然估计;邻域

5、平滑;测地线距离A b s t r a c tS i n c et h e2 0 t hc e n t u r y6 0 S ,t h er a p i dd e v e l o p m e n to fc o m p u t e rt e c h n o l o g yp r o v i d e sap o w e r f u lt o o lf o rd e a l i n gw i t hc o m p l e xd a t a ,w h i c ha l s om a k e st h eh i g h - d i m e n s i o n a ld a t aa n a l y s

6、 i st e c h n i q u e sh a v ev i g o r o u sd e v e l o p i n g T h ei n t r i n s i cd i m e n s i o ne s t i m a t i o no fh i g h - d i m e n s i o n a ld a t a ,i si m p o r t a n ti nt h ef i e l do fh i g h - d i m e n s i o n a ld a t ap r o c e s s i n g I th a sav e r yh i g hi m p o r t a

7、 n c ea n du r g e n c yf o rf i n d i n gt h ei n t r i n s i cd i m e n s i o n I n t r i n s i cd i m e n s i o ni sa nu n k n o w nq u a n t i t yw h i c hn e e d st ob ee s t i m a t e df o rd i m e n s i o nr e d u c t i o na l g o r i t h m s ,i fw ec a nq u i t ea c c u r a t e l yf i n dt h

8、 ei n t r i n s i cd i m e n s i o no fh i l g h d i m e n s i o n a ld a t a , t h e r ew a sn o td o u b tt h a tt h ef i g h td i m e n s i o ne s t i m a t i o nh a sa ni m p o r t a n tg u i d i n gs i g n i f i c a n c ef o rd i m e n s i o nr e d u c t i o na l g o r i t h m s T h ea c c u r

9、a t ei n t r i n s i cd i m e n s i o ne s t i m a t i o na l s op r o f i tt os e l e c ta l la p p r o p r i a t en e i g h b o r h o o ds i z ei nd a t ap r o c e s s i n gf o ra v o i d i n gd i m e n s i o n a l i t yc u r s e T h i sp a p e rp r o p o s e san e wa p p r o a c hf o ri n t r i n

10、 s i cd i m e n s i o ne s t i m a t i o nb a s e do nM L E( M a x i m u mL i k e l i h o o dE s t i m a t i o n ) G e n e r a l l y , n e i g h b o rr e l a t i o n s h i pc a na d e q u a t e l yr e f l e c tt h el o c a lg e o m e t r i cc h a r a c t e r i s t i c so ft h ed a t a M L Em e t h o

11、 dc o n s t r u c t e dt h el i k e l i h o o df u n c t i o nb e t w e e nt h ed i s t a n c e so fc l o s en e i g h b o r s ,t og e tt h em a x i m u ml i k e l i h o o de s t i m a t ei n t r i n s i cd i m e n s i o n T h et r a d i t i o n a lM L Ea l g o r i t h m sh a st w os h o r t a g e ,

12、o n ei st h a ti tj u s ts i m p l ym a k i n ga na v e r a g ef o rt h ei n t r i n s i cd i m e n s i o ne s t i m a t i o no fd i f f e r e n ts a m p l ep o i n t si nt h es a m en e i g h b o r h o o d ,w h i c hw i l lb es u b j e c t e di n t e r f e r e n c eb e c a u s eo fS i n g u l a rv

13、a l u e ,t h eo t h e ri st h a ti tu s e sE u c l i d e a nd i s t a n c et oo p t i o nt h ekn e i g h b o r s ,w h i c hl i k e l ya p p e a r e dl a y e r sp h e n o m e n o n I no r d e rt os o l v et h es h o r t a g e ,w eu s eN S ( n e i g h b o r h o o ds m o o t h i n g ) a l g o r i t h m

14、 si n s t e a do fm e a na l g o r i t h m s ,a n du s eg e o d e s i cd i s t a n c ei n s t e a do fE u c l i d e a nd i s t a n c et of i n dt h er e a lK - n e i g h b o rp o i n t sw h e nw es e l e c tKn e i g h b o r s W em a k et h ee x p e r i m e n to ns i m u l a t i o nd a t as e t sa n

15、dr e a ld a t as e t s ,t h er e s u l t ss h o w e dt h a to u rm e t h o di se f f e c t i v e ,i tc a nf i n dm o r er e a s o n a b l ei n t r i n s i cd i m e n s i o n K e yw o r d s :i n t r i n s i cd i m e n s i o n ;M a x i m u mL i k e l i h o o dE s t i m a t i o n ;N e i g h b o r h o o dS m o o t h i n g ;g e o d e s i cd i s t a n c e目录摘要I A B S T I 认c T I I目录I I I第一章引言11 1 本征维数估计方法背景知识1 1 2 本征维数估计方法的研究目的与意义2 1 3 本征维数估计方法的研究现状2 1 4 本文主要内容2第二章本征维数估计方法分析42 1 包数方法4 2 1 1 相关概念4 2 1 2 基于包数的本征维数估计算法52 2K 一近邻图方法

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号