主成分分析算法解析

上传人:平*** 文档编号:25399156 上传时间:2017-12-13 格式:PPT 页数:29 大小:5.85MB
返回 下载 相关 举报
主成分分析算法解析_第1页
第1页 / 共29页
主成分分析算法解析_第2页
第2页 / 共29页
主成分分析算法解析_第3页
第3页 / 共29页
主成分分析算法解析_第4页
第4页 / 共29页
主成分分析算法解析_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《主成分分析算法解析》由会员分享,可在线阅读,更多相关《主成分分析算法解析(29页珍藏版)》请在金锄头文库上搜索。

1、主成分分析算法的研究,报告人:周卫林2016.4.15,主成分分析算法,3原理,5数学描述,6数学推导,7计算步骤,9程序演示,主成分分析算法的背景,指标,在实际工程领域的研究中,为了全面、系统地分析问题,我们必须考虑众多的影响因素。,在多元统计分析中也称为变量。,主成分分析算法的背景,每个变量都在不同程度上反映了所研究问题的某些信息,并且变量之间彼此有一定的相关性,因而使得统计后的数据反映的信息在一定程度上存在重叠。,主成分分析算法的产生原因,主成分分析算法的背景,在用统计方法研究多变量问题时,变量太多会大大增加计算量和问题的复杂度,会耗费很多硬件、网络资源,所以人们希望在进行定量分析的过程

2、中,通过较少的变量得到较多的信息量。,主成分分析算法的产生原因,主成分分析算法的提出,主成分分析(Principal Component Analysis),首先是由K.Pearson在1901年的生物学理论研究中引入的;,之后H.Hotelling将此方法推广到心理学中随机向量的情形,使主成分分析得到进一步发展;,1947年,Karhunen独立地用概率论的形式再次描述了主成分分析算法;,其后,Loeve将该理论进一步扩充和完善。因此主成分分析也有其它名称,又叫做KLT(Karhunen一Loeve Transform)或者Hotelling变换。,卡尔 皮尔逊(Karl Prarson,1

3、857-1936),英国生物学家和统计学家 。,他是现代统计学的奠基人之一 ,他的主要成就和贡献是在统计学方面。他开始把数学运用于遗传和进化的随机过程,首创次数分布表与次数分布图,提出一系列次数曲线;推导出卡方分布,提出卡方检验,用以检验观察值与期望值之间的差异显著性;发展了回归和相关理论;为大样本理论奠定了基础。皮尔逊的科学道路,是从数学研究开始,继之以哲学和法律学,进而研究生物学与遗传学,集大成于统计学。,卡尔 皮尔逊(Karl Prarson,1857-1936),英国生物学家和统计学家 。,他是现代统计学的奠基人之一 ,他的主要成就和贡献是在统计学方面。他开始把数学运用于遗传和进化的随

4、机过程,首创次数分布表与次数分布图,提出一系列次数曲线;推导出卡方分布,提出卡方检验,用以检验观察值与期望值之间的差异显著性;发展了回归和相关理论;为大样本理论奠定了基础。皮尔逊的科学道路,是从数学研究开始,继之以哲学和法律学,进而研究生物学与遗传学,集大成于统计学。,主成分分析算法的原理,以某些线性组合来表示原始数据,再从这些线性组合中尽可能快地提取原始数据的信息。 当第一个线性组合不能提取更多的信息时,再考虑用第二或更多的线性组合继续快速提取数据信息直到所提取的信息与原始数据包含的信息相差不多或者满足用户精度要求。 这些线性组合依次被称为第一主成分(主分量)、第二主成分(主分量),主成分分

5、析在二维空间的几何意义,主成分分析在二维空间的几何意义相当于坐标旋转。,主成分分析在二维空间的几何意义,主成分分析在二维空间的几何意义相当于坐标旋转。,主成分分析在二维空间的几何意义,经过坐标变换可以看到,在新坐标系y1Oy2下m个散点的坐标Y1和Y2几乎不相关。散点总是沿着y1和y2方向分布,它们在y1轴上的方差达到最大,在y2轴上的方差次之,所以在这两个方向上散点的离散程度很小。,在这里,我们把Y1称为第一主成分,Y2称为第二主成分。,主成分分析的数学描述,主成分分析就是针对原始数据,要寻求那些主成分并以它们为坐标轴构建一个新的坐标系,使得原始数据在新坐标轴上的投影的方差最大。 主成分分析

6、可用数学语言描述为:给定n维空间中的m个数据(如图像信息、工业参数、基因指标等),寻求一个nxn维的变换矩阵W,使得Y=y1,y2,ym=WTX,而且满足新坐标系下各维之间数据的相关性最小,或者说一个去相关性的过程。,主成分分析的数学推导,在下列所有运算中均有i、k1,n,j1,m。,假设有m个n维数据组成的矩阵,其中,xi=xi1,xi2,xim。,X的均值矩阵和协方差矩阵分别记为,主成分分析的数学推导,另外,假设转换矩阵,其中,wi=wi1,wi2,winT 。,主成分分析的数学推导,考虑如下的线性变换:,用矩阵形式表示为:,主成分分析的数学推导,我们需要寻求一组新的变量Y1,Y2,.,Y

7、d(dn),这组新的变量要求能充分地反映原变量X1,X2,.,Xn的信息,而且相互独立。,对于Y1,Y2,.,Yd有:,这样我们所要解决的问题就转化为,在新的变量 Y1,Y2,.,Yd相互独立的条件下寻求,,使得,达到最大。,主成分分析的数学推导,下面依次求取各主成分,构造目标函数,并对目标函数,微分,有,即,两边分别左乘,,可得,主成分分析的数学推导,是X的协方差矩阵,的特征方程,因为,是非负定的,所以特征根均大于0,假设,由式,可知Y1的方差为,也就是说,Y1的最大方差为,,其相应的单位化特征向量是,的最大方差为第k大特征根,,其相应的单位化特征向量是,主成分分析的数学推导,由上述推导,我

8、们得到以下结论:设,的协方差矩阵为,,其特征根为,相应的单位化特征向量为,则由此所确定的主成分是,主成分分析的计算步骤,1、计算原始数据矩阵X矩阵的均值矩阵,即对每维(行)数据计算平均值,,,主成分分析的计算步骤,2、计算中心平移矩阵,即把每维数据减去由上式求出的平均值,主成分分析的计算步骤,3、计算数据的协方差矩阵,其中,a,b1,n。,主成分分析的计算步骤,4、对协方差矩阵进行特征分析,使,这里,它们分别是协方差矩阵的特征值和对应的特征向量。将特征值按照由大到小的顺序排列,对应的特征向量也作相应排列。,主成分分析的计算步骤,5、取前d个特征值,和特征向量,作为子空间的基底,那么主成分可以由

9、中心平移矩阵,在d个基底上投影得到,即,主成分分析的应用,主成分分析是数据降维技术的典型算法,它通过对矩阵的特征分析把原始数据投影到包含了大部分数据信息的线性子空间中达到数据降维的目的,它的优点在于计算过程简单,数据信息丢失很少。,在现代科学领域,特别是在网络入侵检测、图像处理、多元统计分析、生物医学等应用场合,主成分分析在图像处理中的应用,图像匹配,图像匹配是根据已知的图像模式,在另一幅图像中寻找相应或相近模式的过程。,人脸识别是模式识别和图像处理等学科的一大研究热点,在身份鉴别、信用卡识别、护照核对以及监控系统等方面有着广泛的应用。,主成分分析在图像处理中的应用,人脸识别是将检测出的人脸与

10、数据库中的已知人脸进行比较,得出有关身份方面的信息。即解决“这是谁的脸?” 识别的关键是人脸特征的选择和提取,只有选取适当的人脸表征方式,以及匹配策略,才能得到较高的识别率。,主成分分析在图像处理中的应用,目标跟踪,运用模板匹配定位从而实现目标跟踪的方法是目前的成像跟踪系统通常采用的方法。,主成分分析(PCA)具有数据分离和信息压缩等有用的特性,运用主成分分析的方法可以根据图像的整体特征,构造目标的特征子空间(即由主成分生成的子空间),从而较好地克服噪声干扰和图像畸变的影响,完成对目标的匹配定位和跟踪。,主成分分析在图像处理中的应用,特征提取,图像处理中一个非常重要的环节,如何提取有效的判别特征是解决问题的关键。,基于主成分分析可以保持数据的全局性,使得降维后的数据从整体上较好的重构和展现。对图像应用主成分分析可以对目标图像的几个重要成分信息进行分析,在尽可能少的损失原有信息的基础上,将图像的主要特征提取出来,为接下来的图像分类和匹配提供良好的条件。,谢谢!欢迎老师和各位同学批评指正!,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号