内点法在支撑向量机中的应用

资源描述

《内点法在支撑向量机中的应用》由会员分享，可在线阅读，更多相关《内点法在支撑向量机中的应用（45页珍藏版）》请在金锄头文库上搜索。

1、摘要支撑向量机方法是近年来兴起的一种重要的机器学习方法，主要应用于信息分类问题. 其核心技巧是利用高维超平面将需要被分类的信息分开，并且使得类与类之间的距离最大化在训练支撑向量机的过程中斤面临的最大间题是需要求解一个大规模的二次规划间题.这个二次规划问题可以在优化理论的框架下被解决. 本丈针对支撑向量机中遇到的这类特殊的二次规划问题给出了很好的解映方案. 该方法整合了 “ 初值技巧” 和 “ 动态权” 技巧. 从数值试验的结吴可以看出，该方法提高了训练模型的准确度和计算速度. 这一方法还被应用于数字手写检索中，被

2、证明是一种行之有效的方法. K e tv vo r d s :内点法，二次规划，支撑向量机，信息检索 I n t e r i o r P o i n t Me t h o d i n S u p p o r t V e c t o r Ma c h i n e Ka i S lid S u p e r v i s e d b y P r o f e s s o r Y a - x i a n g Y u a n In s t it u t e o f C o m p u t a t i o n a l Ma t h e m a t i c s a n d S c i e n t

3、 i fi c / E n g i n e e r i n g C o mp u t i n g , A c a d e my o f Ma t h e m a t i c s a n d S y s t e m S c ie n c e s , C h i n e s e A c a d e m y o f S c i e n c e s , B e ij i n g , 1 0 0 0 8 0 , P e o p l e s R e p u b li c o f C h i n a Abs t r a c t T h i s t h e s i s p r o p o s e s a n

4、e w r o b u s t a l g o r i t h m f o r S u p p o r t V e c t o r Ma - c h i n e ( S V M) . T h e S u p p o r t V e c t o r Ma c h i n e i s a n e w a n d v e r y p o w e r f u l c l a s s i fi c a t i o n t e c h n i q u e . T h e k e y i d e a o f t h i s t e c h n i q u e i s t o s e p a r a t e

5、t h e c l a s s e s w i t h a h y p e r - s u r f a c e t h a t m a x i m i z e s t h e m a r g i n b e t w e e n t h e m . I n t r a i n i n g t h e S V M, t h e c o r e p r o b l e m o n e m u s t f a c e i s t o m i n im i z e a c e r t a i n q u a d r a t i c f u n c t i o n . T h e r e f o r e

6、, t h e S V M p r o b l e m c a n b e c o n v e r t e d i n t o a ma t h e ma t i c a l f o r m u n d e r t h e f r a me w o r k o f o p t i mi z a t i o n t h e o r y . I n t r a i n i n g S VM o r o t h e r o p t i mi z a t i o n p r o b l e ms , t h e i n i t i a l f e a s i b le p o i n t h a s

7、d i r e c t e ff e c t o n t h e p e r f o r m a n c e o f a n a l g o r i t h m . W e p r e s e n t a d e c o m p o s i t i o n a l g o r i t h m t h a t c a n b e u s e d t o t r a i n S V M o v e r l a r g e d a t a s e t s . T h i s a l g o r i t h m c o m b i n e s w i t h t h e t e c h n i q u

8、 e o f c h o o s i n g p r o p e r i n i t i a l p o i n t a n d d y n a mi c w e i g h t t e c h n i q u e t o i mp r o v e t h e s p e e d a n d t h e a c c u r a c y o f c l as s i c a l a l g o r i t h m We h a v e d e v e l o p e d a s o f t w a r e p a c k a g e b a s e d o n t h i s n e w a l

9、 g o r i t h m T h i s s o f t w a r e p a c k a g e o p e n s p o t e n t i a l in m a n y P z p e c t s , s u c h a s b e t t e r o p t i - m iz a t io n a lg o r it h m s , t h e u s e o f S V M in in fo r 哭 a tio n r e t r ie v a l, p a t te r n r e c o g - n i t i o n o r o t h e r a p p l i c

10、a t io n s . Ke y w o r d s Q u a d r a t i c P r o g r a m m i n g , I n t e r io r P o i n t Me t h o d , S u p p o r t V e c t o r Ma c h i n e . I n f o r ma t i o n Re t r i e v a l 致谢作者要对导师袁亚湘研究员和北京大学的徐树方教授表示衷心的感谢和崇高的敬意.在我攻读硕士学位的三年期间，袁老师给了我非常多的帮助.徐老师对我多年来持续不断的指导在我的成长中起到了非常重要的作用. 他们不仅在学

11、习和科研方面给我指导和鼓励，还在思想方面给我深刻的启迪.作为良师，他们精深渊博的学识，严谨的治学态度，独特新颖的思考和诲人不倦的教导，无不在我的脑海里留下了不可磨灭的印象，并将一直影响着我今后的学习和工作，令我终身受益. 作者非常感谢M ic r o so ft R e s e a r c h A s ia 的王坚老师， D a rt m o u th U n i- v e r s ity 的吕思伟师兄和M ic r o s o ft R e s e a r c h A s ia 的邹宇师兄，是他们在我对支撑向量机一无所知的时候给

12、予我非常多帮助和鼓励另外没有 U n iv e r s ity o f M a ry la n d C o lle g e P a rk 的凌海滨师兄和 U n iv e r s ity o f C a li- fo r n ia B e rk e le y 的魏子乐师兄的帮助，我的很多问题是无法完成的. 他们都是我在学习工作中的朋友，他们的榜样作用一直鼓励着我不断前进.在此对他们一并感谢，也祝他们今后的事业成功. 作者还要非常感谢王明艳和王彦飞博士，他们在许多问题上给了我很多宝贵的经验和现实的帮助作者也要同时感谢课题组的魏紫变老师，戴或虹老师，以及优化讨

13、论班的所有其他成员，他们都是我的良师益友每次讨论班上大家的热烈探讨都带给我新的想法和启示. 另外，对M c M a s t e r U n iv e rs ity 的T a m a s T e r la k y 在我做论文期间的关心和帮助表示感谢. 作者要感谢科学与工程计算国家重点实验室的张时珍老师和白，英老师，感谢他们对我学业和生活上的帮助. 最后，作者愿意把本文献给他的家人一亲爱的父亲，母亲和爱人庞海英，正是他们对我一如既往的全力支持，热情鼓励和他们最无私最伟大的爱支持着我在自己选择的道路上坚定地走下去. 第一章

14、引言在这一章里，我们将简要地介绍支撑向量机理论的现状以及其与最优化数学理论的联系. 经 1 .1 机器学习理论简介人类文明之所以能够发展到今天，一个很重要的原因就是人具有很强的学习能力. 这种能力帮助人们对未知世界做出正确的判断，在人们对计算机人工智能的探索中，希望计算机能够模拟人类的这种学习能力，这就是我们所谓的机器学习问题我们的目的是通过对己知的数据进行分析，发现数据之间内在的联系或规律，从而对未知数据进行判断. 在大约4 0 年以前，F . R o s e n b la t t 1 1 1 提出了第一个学习机

15、器的模型，称作感知器.这标志着人们对学习过程进行数学研究的第一步. R o s e n b la t 做的不同寻常的事就是把这个模型表现为一个计算机程序，并且通过实验说明这个感知器模型的可推广性.在R o s e n b la tt 的感知器实验后，人们很快提出了其他类型的学习机器模型. 这些模型从一开始就被用来解决实际问题，而没有被看作是学习现象的一般模型. R o s e n b l a t t 的第一个实验是针对数字识别问题做的.甚至在 8 0 到 9 0 年代，数字识别问题也一直是一个重要的研究方向.为了得到更好的决策规则，现在人们甚至采

16、用数百万以上的几百维观测数据.人工智能的研究者在这一领域里起到了很大的作用.值得一提的是，感知器被改称为神经网络. 在 6 0 和7 0 年代，学习问题的主要目标是从少量样本出发寻找规则; 而 8 0 年代，目标变为研究人是如何学习的. 这些研究很多是与生物生理学者共同进行的，但是这并不一定是建立学习机器的好方法. 1 9 8 4 年，V a lia n t 1 7 1 提出了可能近似度模型 (P r o b a b ly A p p ro x i- m a t e ly C o r r e c t ，简称P A C ) . 他使得人工智能领域认识到统计学在机器学习中的重要性在过去的 1 0 几年中，与神经网络相关的研究集中在对神经网络的替代方法的研究上. 统计学习理论中的比较高级的内容吸引了很多的研究人员.在过去的几年里，结构风险最小化原则和最小描述长度原则成了一个研究热门. 在很多的实际问题中，神经网络都显示出了比第一章引言了较好的效果，从这个

展开阅读全文