以Excel和SPSS为工具的管理统计 教学课件 ppt 作者 7-302-11702-0 管理统计第10章

上传人:E**** 文档编号:89353761 上传时间:2019-05-23 格式:PPT 页数:28 大小:295KB
返回 下载 相关 举报
以Excel和SPSS为工具的管理统计 教学课件 ppt 作者 7-302-11702-0 管理统计第10章_第1页
第1页 / 共28页
以Excel和SPSS为工具的管理统计 教学课件 ppt 作者 7-302-11702-0 管理统计第10章_第2页
第2页 / 共28页
以Excel和SPSS为工具的管理统计 教学课件 ppt 作者 7-302-11702-0 管理统计第10章_第3页
第3页 / 共28页
以Excel和SPSS为工具的管理统计 教学课件 ppt 作者 7-302-11702-0 管理统计第10章_第4页
第4页 / 共28页
以Excel和SPSS为工具的管理统计 教学课件 ppt 作者 7-302-11702-0 管理统计第10章_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《以Excel和SPSS为工具的管理统计 教学课件 ppt 作者 7-302-11702-0 管理统计第10章》由会员分享,可在线阅读,更多相关《以Excel和SPSS为工具的管理统计 教学课件 ppt 作者 7-302-11702-0 管理统计第10章(28页珍藏版)》请在金锄头文库上搜索。

1、1,本章教学目标: 掌握回归主成分分析的基本概念、基本原理及其分析应用的基本步骤; 掌握使用软件进行主成分分析; 能应用主成分分析方法解决实际问题,第10章 主成分分析,2,本章主要内容:,10.1 主成分分析的概念 10.2 主成分计算 10.3 样本主成分 10.4 主成分的选取 10.5 案例分析 10.6 上机实现 本章内容重点: 主成分分析的概念; 主成分的选取;上机实现,3,在实证数据分析研究中,人们为了尽可能完整地搜集信息,对于每个样本往往要观测它的很多项指标,少者四、五项,多则几十项,这些指标之间通常不是相互独立而是相关的。因此,从统计分析或推断的角度来说,人们总是希望能把大量

2、的原始指标组合成较少的几个综合指标,从而使分析简化。 例如,一个人的身材需要用好多项指标才能完整地描述,诸如身高、臂长、腿长、肩宽、胸围、腰围、臀围等,但人们购买衣服时一般只用长度和肥瘦两个指标就够了,这里长度和肥瘦就是描述人体形状的多项指标组合而成的两个综合指标。,10.1 主成分的概念,4,假设观测指标共有p个,分别用x1, x2,xp,表示,将这些指标综合为一个指标的方法显然有很多,但最简单的方法是将这些指标用线性组合的方法将它们组合起来。因此,可设定其综合指标的形式为这些指标的线性组合,即 我们希望构造少数几个这样的综合指标,并且这几个综合指标之间是不相关的。 其中反映原始观测指标的变

3、动程度最大的综合指标最重要,我们称其为原始观测指标的第一主成分;而反映原始观测指标变动程度次大的综合指标,称为原始观测指标的第二主成分;反映原始观测指标变动程度第三大的综合指标,称为第三主成分;,,5,10.2 主成分计算,设p个指标(随机变量)是p维随机变量,其协方差矩阵为 式中,协方差 限制 求 的最大值。 实际上,这就是求的 的值,6,根据线性代数的理论,我们知道这就是矩阵 的最大特征根 ,并且 就是相应的特征向量。 就为随机向量X的第一主成分。 X的第二主成分不应该再重复反映第一主成分已经反映的内容,所以求第二主成分时,除了有类似于第一主成分的约束条件外,还必须加上第二主成分与第一主成

4、分不相关这一条件,即 要使 也就是要使 即第二主成分的特征向量必须于第一主成分的特征向量正交。,7,事实上,由于协方差矩阵为非负定矩阵,故有p个非负特征根,从而可求出p个特征向量 将每一个特征向量作为一个主成分的系数向量,就可得出p个主成分。 若记p个主成分组成的主成分向量为 特征向量 组成的矩阵为A ,即 则可写成主成分向量的表达形式为:,8,我们有 即 不相关 各自的方差为 总的方差是 我们从 中,选出对方差贡献最大的部分指标,就达到了主成分分析的目的。,9,例10.1,假设市场上肉类、鸡蛋、水果3种商品价格的月份资料的协方差矩阵为: 试求这3种价格的主成分。 解:根据上述协方差矩阵,可写

5、出其特征多项式为 令此特征多项式为0,则得特征方程,解此特征方程,从而得的特征值为,10,得这些特征根分别代入特征方程,然后求解就可得到相应的各个特征向量,将这些特征向量单位化,就得到相应于上述3个特征根的3个单位特征向量分别为: 于是,3种商品价格的3个主成分分别为,11,在解决实际问题时,总体的协方差和相关阵往往都是未知的,需要通过样本来进行估计。设样本数据矩阵为 则样本协方差矩阵为 样本相关矩阵记为,10.3 样本主成分,12,由主成分分析的基本思想和计算过程可以看出,主成分分析是把p个随机变量的总方差tr()分解为p个不相关的随机变量的方差之和。各个主成分的方差即相应的特征根表明了该主

6、成分的方差,方差的值越大,表明主成分综合原始变量的能力越强。 累计贡献率: 在研究实际问题时,一般要求累计贡献率不小于85。,10.4 主成分的选取,13,虽然主成分的贡献率这一指标给出了选取主成分的一个准则,但是累计贡献率只是表达了前m个主成分提取了的多少信息,它并没有表达某个变量被提取了多少信息,因此仅仅使用累计贡献率这一准则,并不能保证每个变量都被提取了足够的信息。因此,有时还往往需要另一个辅助的准则。 由于 ,所以 显然 是第j个主成分所能说明的第i个原始变量的方差,即第j个主成分从第i个原始变量中所提取的信息。,14,原始变量 的信息提取率 定义为: 我们选取主成分时,不仅要使前m个

7、主成分的累计贡献率达到一定的程度,而且还要使每个原始变量的信息提取率也达到一定的程度。,15,【10.3】,假设某商场运动鞋、凉鞋、皮鞋3种消费量的协方差矩阵为 试求各主成分,并对各主成分的贡献率及各个原始观测变量的信息提取率进行讨论。 【解】由上述协方差矩阵,写出其特征多项式为,16,令此特征多项式为0,得特征方程。求解特征方程,得三个特征根分别为 将各个特征根代入特征方程,求解相应的齐次线性方程,得到各个特征向量,经过单位化处理,就得到相应的三个单位化特征向量分别为,17,如果我们只取一个主成分,则累计贡献率为 效果似乎已经很理想。但是,如果我们进一步计算每个变量的信息提取率,则,18,需

8、再取第2个主成分,此时累计贡献率为 各个变量的信息提取率分别为,19,在制定服装标准的过程中,对128名成年男子的身材进行了测量,每人测得的指标中含有这样6项:身高、坐高、胸围、手臂长、肋围和腰围。所得相关矩阵如表10.1所示。,10.5 案例分析,20,前三个主成分分别为,21,SPSS软件FACTOR模块提供了主成分分析的功能。我们采用11.5版本。下面,我们以SPSS软件包自带的数据Employee data为例,介绍主成分分析的上机实现方法,在SPSS软件的安装目录下可以找到该数据集。 数据Employee data 为 Midwestern 银行在19691971年之间雇员情况的数据

9、,共包括474条观测及以下10个变量:Id (观测号)、Gender(性别)、Bdate (出生日期)、Educ (受教育程度)、Jobcat (工作种类)、Salary (目前年薪)、Salbegin(开始受聘时年薪)、Jobtime(受雇时间(月)、Prevexp(受雇以前的工作时间(月)、Minority(是否少数民族)。下面我们用主成分分析方法处理该数据,以期用少量的变量来描述该地区居民的雇用情况。,10.6主成分分析的上机实现,22,进入SPSS软件,打开数据集Employee data后,依次执行AnalyzeData ReductionFactor命令,系统弹出选择变量和分析内容

10、的主窗口,如图10.1所示。,23,依次选中变量Educ,Salary,Salbegin,Jobtime,Prevexp并单击向右的箭头按钮,这5个变量变进入了图1中variable窗口。单击右侧的OK按钮,即可得到输出结果1。,24,25,26,由SPSS软件默认选项输出的结果,我们还不能得到用原始变量表示出主成分的表达式,要得到这个结果,就需要对Factor Analysis模块中的设置做一些调整,方法如下: 进入Factor Analysis对话框并选择好变量之后,单击对话框下部的Scores按钮进入Factor Scores对话框,如图10.3所示。,27,28,输出结果2给出了用原始变量表示主成分的系数信息,因为系统默认是从相关矩阵出发进行分析,所以,上面表格中的系数是将原始变量标准化后表示主成分的系数。这样求得的每个主成分的方差等于1,而不是原始变量相关矩阵的各个特征根了。此例中第一主成分的方差为2.477,要得出标准化的变量的第一主成分,只需将SPSS软件给出的系数前面乘以主成分方差的平方根即可。关系式如下:,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号