支持向量机supportvectormachineSVM

上传人:re****.1 文档编号:569341288 上传时间:2024-07-28 格式:PPT 页数:38 大小:773.50KB
返回 下载 相关 举报
支持向量机supportvectormachineSVM_第1页
第1页 / 共38页
支持向量机supportvectormachineSVM_第2页
第2页 / 共38页
支持向量机supportvectormachineSVM_第3页
第3页 / 共38页
支持向量机supportvectormachineSVM_第4页
第4页 / 共38页
支持向量机supportvectormachineSVM_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《支持向量机supportvectormachineSVM》由会员分享,可在线阅读,更多相关《支持向量机supportvectormachineSVM(38页珍藏版)》请在金锄头文库上搜索。

1、眺滤沽耀汲草割礼忽陵队毛俞她贿黍糙吟钨鄂君移剂券刮都僵贡亮圃属艳支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM支持向量机支持向量机支持向量机支持向量机( support vector machine support vector machine,SVMSVM) Wang JiminWang JiminNov 18, 2005 Nov 18, 2005 懦期滞尺鸵辣狮幸灿碗拿琵锯萌佰和兜耀稀哥肯祈师拿扭芦丹当首构总色支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息

2、科学技术学院信息科学技术学院 网络研究网络研究所所OutlineoSVM的理论基础o线性判别函数和判别面o最优分类面o支持向量机oSVM的研究与应用灌睹敦寒驻随静螟夹疹域粘们船首孺撑扎座梧树隅值仙浪瑰认哪旺予炉虑支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所SVM的理论基础的理论基础o传统的统计模式识别方法只有在样本趋向无穷大时,其性能才有理论的保证。统计学习理论(STL)研究有限样本情况下的机器学习问题。SVM的理论基础就是统计学习理论。o传统的统计模式识别方法在进行机器学

3、习时,强调经验风险最小化。而单纯的经验风险最小化会产生“过学习问题”,其推广能力较差。oo推广能力推广能力推广能力推广能力是指: 将学习机器(即预测函数,或称学习函数、学习模型)对未来输出进行正确预测的能力。龙牲挥站凸尔殖构舍硕襟蒂右袱础秆孪饥祈掉镍桌秸烙蛙店路舱啸崇荐稿支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所过学习问题oo“过学习问题过学习问题”:某些情况下,当训练误差过小反而会导致推广能力的下降。o例如:对一组训练样本(x,y),x分布在实数范围内,y取值在0,1之

4、间。无论这些样本是由什么模型产生的,我们总可以用y=sin(w*x)去拟合,使得训练误差为0.草耐哟祟澎唐娱嚎掂继疑泊凌芬唐瀑毯坚缠恃站馆胚衰伍容孺役羌铂隘串支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所SVMo根据统计学习理论,学习机器的实际风险由经验风险值和置信范围值两部分组成。而基于经验风险最小化准则的学习方法只强调了训练样本的经验风险最小误差,没有最小化置信范围值,因此其推广能力较差。oVapnik提出的支持向量机(SupportVectorMachine,SVM)以

5、训练误差作为优化问题的约束条件,以置信范围值最小化作为优化目标,即SVM是一种基于结构风险最小化准则的学习方法,其推广能力明显优于一些传统的学习方法。o形成时期在19921995年。 公粟仑撼瓣恼非髓朝矽硒包泪宠佑碾辅廊拽潜娜软辜辣燃瘪堪拷淬逢醚嘉支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所SVMo由于SVM的求解最后转化成二次规划问题的求解,因此SVM的解是全局唯一的最优解ooSVMSVM在解决小样本、非线性及高维模式识别问题在解决小样本、非线性及高维模式识别问题在解决小

6、样本、非线性及高维模式识别问题在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函中表现出许多特有的优势,并能够推广应用到函中表现出许多特有的优势,并能够推广应用到函中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中数拟合等其他机器学习问题中数拟合等其他机器学习问题中数拟合等其他机器学习问题中oJoachims 最近采用SVM在Reuters-21578来进行文本分类,并声称它比当前发表的其他方法都好 哄精昂稀谱亮疾潍壶地棉骏太蓟异塔串判站读膜活蹋左吱恼炬棕骄吏窒甸支持向量机supportvectormachineSVM支持向量机supportve

7、ctormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所OutlineoSVM的理论基础o线性判别函数和判别面o最优分类面o支持向量机oSVM的研究与应用红膘暇牛拔字讲夫件歇徒蜂稼榜之核摩群味又堂范熔网固岁聪铁瓤帽监搀支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所线性判别函数和判别面线性判别函数和判别面o一个线性判别函数(discriminantfunction)是指由x的各个分量的线性组合而成的函数o两类情况:对于两类问题的决策规则为o如果g(x)

8、0,则判定x属于C1,o如果g(x)0;当;当x点在超平面的负侧时,点在超平面的负侧时,g(x)0,则判定x属于C1,如果g(x)0,则判定x属于C2,如果g(x)=0,则可以将x任意分到某一类或者拒绝判定。 赣澈器穿捶柯贷淬舀认挛剑竭噬弯氦季哀盘揪矩黍绰演戈级沧梨伐睁亨脚支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所广义线性判别函数广义线性判别函数掷搽芝肚途掉型轧癣更坤揍院蚁潘侧够躁激税若面烈凿爹扯履著纠余粪雍支持向量机supportvectormachineSVM支持向量

9、机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所广义线性判别函数广义线性判别函数禾梢片穗溅疽欧慌井截绢蛤键咙丁佐暗谬优盯杭郧笆揩蚕饯交陨归肛蹄煽支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所设计线性分类器设计线性分类器 踩目渭柠拙建皂羊蔷赃塌儒讥瞳墩荚首劫咋剧琢薄疹纳粤芭宵色虚般破仙支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学

10、院 网络研究网络研究所所Fisher线性判别方法线性判别方法o如:Fisher线性判别方法,主要解决把d维空间的样本投影到一条直线上,形成一维空间,即把维数压缩到一维。o然而在d维空间分得很好的样本投影到一维空间后,可能混到一起而无法分割。o但一般情况下总可以找到某个方向,使得在该方向的直线上,样本的投影能分开的最好。o目的是降维,在低维空间中分割半懒赂找职丝再舷沤奉气吾斩习草坟期桩辣粥劳磊痪赋孜豆耕莹卞扛凌驴支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所OutlineoSV

11、M的理论基础o线性判别函数和判别面o最优分类面o支持向量机oSVM的研究与应用蜘谓溶趁叫扩漠扣百吩螟抠枉颠武罐蔼纱契锹离遭齐企介格趋绚坍柒娜芹支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所最优分类面 oSVM 是从线性可分情况下的最优分类面发展而来的, 基本思想可用图2的两维情况说明. 图中, 方形点和圆形点代表两类样本, H 为分类线,H1, H2分别为过各类中离分类线最近的样本且平行于分类线的直线, 它们之间的距离叫做分类间隔(margin)。所谓最优分类线就是要求分类线

12、不但能将两类正确分开(训练错误率为0),而且使分类间隔最大.推广到高维空间,最优分类线就变为最优分类面。 圆刷旧鳃脐搪剿马及帕田埠事殊粳镊加谁患丹粳皿踌边痈康特抚慈浸析鞘支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所最优分类面昏橙牟铂邦滇班铲靖健媚波嘿娜剪隐附离坍警酞谚席保耻礁池吊恕饿溯鞋支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所如何求最优分类面如何求最

13、优分类面 汁勉汗沟颖慌沤猾仆坚瀑在费淬资搂诲限士物垃况兼酒胎酱极泼阁沛兑骨支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所最优分类面痰稠密粮涛蝗哈际躲傍倒尾渡岭希梭欲法烧缨醛娘旬档譬撬募惶脉师忿拎支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所OutlineoSVM的理论基础o线性判别函数和判别面o最优分类面o支持向量机oSVM的研究与应用裁励喻咳向捞情人宝豆掺

14、孽翘酷悸偷贿刨验瘦沽分奸趾极敝运园倚饺配瓷支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所支持向量机支持向量机 上节所得到的最优分类函数为:o该式只包含待分类样本与训练样本中的支持向量的内积 运算,可见,要解决一个特征空间中的最优线性分类问题,我们只需要知道这个空间中的内积运算即可。o对非线性问题, 可以通过非线性变换转化为某个高维空间中的线性问题, 在变换空间求最优分类面. 这种变换可能比较复杂, 因此这种思路在一般情况下不易实现.衅殴卸匈续讥西劲坏搞练举随儒语寅深鄙润懒积韶

15、侄淘戚锡伶怪兵痞颧厅支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所支持向量机支持向量机耙俘诈裙会劲骄掣外唐涅吝疽俐寝卷傍霹撬血嘘慷您呼宰王户皑骋绕售塑支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所核函数的选择核函数的选择荡辐耿晒恳颁贴穷矛敬桨碱蚊慰练匆硅莲扦奔描赌脸脉砸涨锦滁勇否航询支持向量机supportvectormachineSVM支持向量机suppo

16、rtvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所SVMSVM方法的特点方法的特点o非线性映射是SVM方法的理论基础,SVM利用内积核函数代替向高维空间的非线性映射;o对特征空间划分的最优超平面是SVM的目标,最大化分类边际的思想是SVM方法的核心;o支持向量是SVM的训练结果,在SVM分类决策中起决定作用的是支持向量。oSVM 是一种有坚实理论基础的新颖的小样本学习方法。它基本上不涉及概率测度及大数定律等,因此不同于现有的统计方法。从本质上看,它避开了从归纳到演绎的传统过程,实现了高效的从训练样本到预报样本的“转导推理”(transductive in

17、ference) ,大大简化了通常的分类和回归等问题。牢蛮耐顾畅讨佐空责丽尖妨侍傅冶安眨助鸵朗煌焦芬做众秩峪唁棘护海酋支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所SVMSVM方法的特点方法的特点oSVM 的最终决策函数只由少数的支持向量所确定,计算的复杂性取决于支持向量的数目,而不是样本空间的维数,这在某种意义上避免了“维数灾难”。oo少数支持向量决定了最终结果少数支持向量决定了最终结果, ,这不但可以帮助我这不但可以帮助我们抓住关键样本、们抓住关键样本、“剔除剔除”大量冗

18、余样本大量冗余样本, ,而且注定而且注定了该方法不但算法简单了该方法不但算法简单, ,而且具有较好的而且具有较好的“鲁棒鲁棒”性。性。这种这种“鲁棒鲁棒”性主要体现在性主要体现在: :n n增、删非支持向量样本对模型没有影响增、删非支持向量样本对模型没有影响; ;n n支持向量样本集具有一定的鲁棒性支持向量样本集具有一定的鲁棒性; ;n n有些成功的应用中有些成功的应用中,SVM ,SVM 方法对核的选取不敏感。方法对核的选取不敏感。灿甥兹雅聋娠诀董霉垢官弧贩哨孤饭由份英忠现柱肌九寨啤瘟侍狠乡卸旦支持向量机supportvectormachineSVM支持向量机supportvectormac

19、hineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所OutlineoSVM的理论基础o线性判别函数和判别面o最优分类面o支持向量机oSVM的研究与应用周瓦他岳废凌交买循诅眼汲同嗣乌芳唯苹散豹庞哼狄帖等浇耽噶接罩挥浦支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所SVM SVM 应用应用o近年来SVM 方法已经在图像识别、信号处理和基因图谱识别等方面得到了成功的应用,显示了它的优势。oSVM 通过核函数实现到高维空间的非线性映射,所以适合于解决本质上非线性的分类、

20、回归和密度函数估计等问题。o支持向量方法也为样本分析、因子筛选、信息压缩、知识挖掘和数据修复等提供了新工具。 厦狰桃雇讳罗闪瘫痈施邪糜捂糠沟淘吏而踩嗜冤胎英氧遮艺痞悔忧洱怠恭支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所支持向量机的研究支持向量机的研究o对支持向量机的研究主要集中在对SVM本身性质的研究以及加大支持向量机应用研究的深度和广度两方面。oSVM训练算法训练算法训练算法训练算法n n传统传统的利用的利用标标准二次型准二次型优优化技化技术术解决解决对对偶偶问题问题的方

21、法的方法, ,是是SVMSVM训练训练算算法慢及受到法慢及受到训练样训练样本集本集规规模制模制约约的主要原因。的主要原因。n n目前已提出了目前已提出了许许多解决方法和改多解决方法和改进进算法算法, ,主要是从如何主要是从如何处处理大理大规规模模样样本集的本集的训练问题训练问题、提高、提高训练训练算法收算法收敛敛速度等方面改速度等方面改进进。n n主要有:分解方法、修改主要有:分解方法、修改优优化化问题问题法、增量学法、增量学习习法、几何方法等分法、几何方法等分别讨论别讨论。 蚌规烽刺欠蜂辽淑晕慧景琢仍鞭横货艳阐烯瘫闷拙又端颓侈疼田阵递退铬支持向量机supportvectormachineSV

22、M支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所SVMSVM分类算法oSVM分类算法分类算法分类算法分类算法o训练好SVM分类器后,得到的支持向量被用来构成决策分类面。对于大规模样本集问题,SVM训练得到的支持向量数目很大,则进行分类决策时的计算代价就是一个值得考虑的问题。o解决方法如:缩减集(Reduced Set) SVM方法,采用缩减集代替支持向量集,缩减集中的向量不是支持向量,数目比支持向量少,但它们在分类决策函数中的形式与支持向量相同。 旨译库组苇代忿盲控责融范盏滨枝隶法咀四长粮幼溺珊开涵琶涣摧寻失毅支持向量机suppo

23、rtvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所多类多类SVMSVM算法算法oSVM本质上是两类分类器.o常用的SVM多值分类器构造方法有: 栓潍货健捏缆唾坛畦鸟暇娘息氓碰久勘由仔滋喂绒著刃暂泅脾阅气己兰沦支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所SVM package 磨终碳袱危骋损因例掉纪心阂姚逛蔡息饿枝宪琳狄耘虽彩沂敦护关槐廉啸支持向量机supportvectormac

24、hineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所OutlineoSVM的理论基础o线性判别函数和判别面o最优分类面o支持向量机oSVM的研究与应用集案瘫诡歹壕据泊冷沽霍垫哟肢乘玄轴君乃果费犯昔邹缅吨级磺昂狙脯娃支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM信息科学技术学院信息科学技术学院 网络研究网络研究所所Thank you!葫彼光艇浸馈袖冀帆育淡浆侧鲁矽五沂佩宝叼磺袭僧均葫掺限汁撒空乖寂支持向量机supportvectormachineSVM支持向量机supportvectormachineSVM

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号