多元填空和简答1

上传人:wt****50 文档编号:37807967 上传时间:2018-04-22 格式:DOC 页数:2 大小:67KB
返回 下载 相关 举报
多元填空和简答1_第1页
第1页 / 共2页
多元填空和简答1_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

《多元填空和简答1》由会员分享,可在线阅读,更多相关《多元填空和简答1(2页珍藏版)》请在金锄头文库上搜索。

1、1 填空题 1多元分析研究的是多个随机变量及其相互关系的 统计总体。 2多元统计中常用的统计量有:样本均值、样本方 差、样本协方差和样本相关系数。 3协方差和相关系数仅仅是变量间离散程度的一种 度量,并不能刻画变量间可能存在的关联程度。 4人们通过各种实践,发现变量之间的相互关系可 以分成相关和不相关两种类型。 5总离差平方和可以分解为回归离差平方和和剩余 离差平方和两个部分,各自的自由度为 p 和 n- p-1,其中回归离差平方和在总离差平方和中所占比 重越大,则线性回归效果越显著。 7偏相关系数是指多元回归分析中,当其他变量固 定后,给定的两个变量之间的的相关系数。 8Spss 中回归方程

2、的建模方法有一元线形回归、多 元线形回归、岭回归、多对多线形回归等。 9主成分分析是通过适当的变量替换,使新变量成 为原变量的综合变量,并寻求相关性的一种方法。 10主成分分析的基本思想是:设法将原来众多具 有一定相关性(比如P 个指标),重新组合成 一组新的互相无关的综合指标来代替原来的指标。11主成分的协方差矩阵为对角矩阵。 12主成分表达式的系数向量是相关系数矩阵的特 征向量。 13原始变量协方差矩阵的特征根的统计含义是原 始数据的相关系数。 14原始数据经过标准化处理,转化为均值为 0 , 方差为 1 的标准值,且其协方差矩阵与相关系数 矩阵相等。 15样本主成分的总方差等于 1 。

3、16变量按相关程度为,在相关性很强程度下,主 成分分析的效果较好。 17在经济指标综合评价中,应用主成分分析法, 则评价函数中的权数为方差贡献度。 19因子分析是把每个原始变量分解为两部分因素, 一部分是公共因子,另一部分为特殊因子。 20变量共同度是指因子载荷矩阵中第 i 行元素的 平方和。 21公共因子方差与特殊因子方差之和为 1 。 22聚类分析是建立一种分类方法,它将一批样哂 或变量按照它们在性质上的亲疏程度进行科学的分 类。 23Q 型聚类法是按样品进行聚类,R 型聚类法是 按变量进行聚类。 24 R 型聚类统计量通常采用具有代表性的变量。 25在聚类分析中需要对原始数据进行无量纲化

4、处 理,以消除不同量纲或数量级的影响,达到数据间 可同度量的目的。常用的无量纲化方法有以下几种: 中心化变换、规格化变换、标准化变换、对数变换。26六种 Q 型聚类方法分别为最短距离法、最长距 离法、中间距离法、重心法、类平均法、可变类平 均法 28判别分析是要解决在研究对象已分成若干类的 情况下,确定新的观测数据属于已知类别中哪一类 的多元统计方法。 29用判别分析方法处理问题时,通常以判别函数 作为衡量新样本点与各已知组别接近程度的指标。 30进行判别分析时,通常指定一种判别规则,用 来判定新样本的归属,常见的判别准则有 Fisher 准 则、贝叶斯准则。 33Fisher 判别法就是要找

5、一个由 p 个变量组成的 线性判别函数,使得各自组内点的离差尽可能接近, 而不同组间点的尽可能疏远。 二、简答题 1简述多元统计分析的作用。 答:能够简化数据的数据结构;能够进行分类 和组合;能够研究指标之间的依存关系;进行预测; 进行假设检验。 2简述矩阵 A 的特征根与特征向量的求法。 3 “最优”回归方程。 答:所谓“最优”回归方程,是指方程中包含 所有对应变量影响比较显著的变量,而不包括对应 变量影响不显著的变量的回归方程 4 简述逐步回归分析方法的基本原理。 原理是,从一个自变量出发,依照自变量对因 变量的影响显著性大小,从大到小逐个引入回归方 程,同时,在逐个自变量选入回归方程的过

6、程中, 如果发现先前被引入的自变量在其后由于某些自变 量的引入而失去其重要性时,可以从回归方程中随 时予以剔除。引入一个变量或剔除一个变量,为逐 步回归的一步,每步都要进行显著性检验,以便保 证每次引入变量前回归方程中只包括显著性变量, 这个过程反复进行,直到既无不显著变量从回归方 程中剔除,又无显著变量需要选入回归方程时为止。5简述主成分的概念及几何意义。 主成分分析是采取一种数学降维的方法,找出几个 综合变量来代替原来众多的变量,使这些综合变量 能尽可能地代表原来变量的信息量,而且彼此之间 互不相关。这种将把多个变量化为少数几个互相无 关的综合变量的统计分析方法就叫做主成分分析或 主分量分

7、析。 8提取样本主成分的原则。 (1)Fi于 Fj不相关。 (2)F1是 X1 ,X2 Xp的一切线 性组合中方差最大的,F2是与 F1不相关的 X1 ,X2Xp 一切线性组合中方差最大。Fp是与 F1 ,FP-1不相关的 X1 ,X1.Xp 一切线性组合中方差 最大。 10思考主成分分析法的应用。 首先,主成分分析可以用于系统评估;其次, 在经济统计研究中,除了经济效益的综合评价研究 外,对不同地区经济发展水平的评价研究,不同地 区经济发展竞争力的评价研究,人民生活水平、生 活质量的评价研究,等等都可以用主成分分析方法 进行研究;另外,主成分分析除了用于系统评估研 究领域外,还可以与回归分析

8、结合,进行主成分回 归分析,以及利用主成分分析进行挑选变量,选择 变量子集合的研究。 11简述因子分析的基本思想。 因子分析是通过变量(或样品)的相关系数矩 阵内部结构的研究,找出存在于所有变量(或样品) 中具有共性的因素,并综合为少数几个新变量,把 原始变量表示成少数几个综合变量的线性组合,以 再现原始变量与综合变量之间的相关关系。其中, 这里的少数几个综合变量一般是不可观测指标,通 常称为公共因子。 12因子旋转。根据因了载荷阵的不唯一性,可对因子载荷阵 实行旋转即用一个正交阵右乘 A,使旋转后的因子 载荷阵结构简化,便于对公共因子解释,这就是因 子旋转。 13因子载荷。 因子载荷:其统计

9、意义是第 1 个变量与第 1 人 公共因子的关系故即表示 Xi 的份量或比重,由于历 史的原因,心理学家将它叫载荷。 14简述系统聚类法的基本思想及主要步骤。 聚类分析是将样品或变量按照它们在性质上 的亲疏程度进行分类的多元统计分析方法。聚类分 析时,用来描述样品或变量的亲疏程度通常有两个 途径,一是把每个样品或变量看成是多维空间上的 一个点,在多维坐标中,定义点与点,类和类之间 的距离,用点与点间距离来描述样品或变量之间的 亲疏程度;另一个是计算样品或变量的相似系数, 用相似系数来描述样品或变量之间的亲疏程度 15简述系统聚类分析法。 是在样品距离的基础上定义类与类的距离,首 先将个样品自成

10、一类,然后每次将具有最小距n 离的两个类合并,合并后再重新计算类与类之间的 距离,再并类,这个过程一直持续到所有的样品都 归为一类为止。这种聚类方法称为系统聚类法。根 据并类过程所做的样品并类过程图称为聚类谱系图。16简述聚类分析和判别分析的区别和联系。 区别:判别分析与聚类分析不同。判别分析是 在已知研究对象分成若干类型(或组别)并已取得 各种类型的一批已知样品的观测数据,在此基础上 根据某些准则建立判别式,然后对未知类型的样品 进行判别分类。聚类分析,并对于一批合定样品要 划分的类型事先不知道,正需要聚类分析来综合确 定类型的。 联系:判别分析与聚类分析往往联合使用,往往是 专职能部门类分

11、析,再进行判别新样品属于哪一类。 建立判别式判别。 17判别分析的基本步骤。 步骤:(1)选择自变量或组变量,并计算各 组单变量描述的计量,对判别分析所要求的前提能 定进行统计检验;(2)推导判别系数组出标准化或 未标准化的典则判别函数系数,并进行安著性检验; (3)建立 Fisher 判别模型,根据 Bayes 规则和 Fisher 规则进行判别组合;4)进行样本回判分析, 对判别系数的结果进行分析;(5)输出结果,根据 实际情况分析出结果,做出结论。 18BAYES 判别法和 FISHER 判别法的比较。 Fisher 判别:又称典则判别,该方法的基本思 想是投影,即将原来在 R 维空间的

12、自变量组合投影 到维度较低的 D 维空间上去,然后在 D 维空间再进 行分类。其优势在于对分布和方差没有什么限制, 应用范围广泛。 Bayes 判别:就是利用经验信息,基本思想是认为 所有 D 个类别都是空间中互斥的子城,每个观测都 是空间中的一点。其优点在于进行多类别判别,但 是它要求总体呈多元正态分布。 5简述逐步判别基本原理。 1.简述:(1)什么是判别分析; (2)请介绍几种常用判别的方法并阐述其 中一种判别方法的基本思想. (1)判别分析就是判别样品所属类型的一种统计方 法。 (2)距离判别法、Fisher 判别法、Bayes 判别法、 逐步判别法(一)距离判别法基本思想:根据已知分

13、类的数 据,计算样品与各类之间的“距离” ,根据样品到类 之间的“距离”大小判别,样品到那个类的“距离” 最小,判样品属于哪个类。(二)Fisher 判别法的基本思想:从多个总体 (类)抽取一定的样本,借助方差分析的思想,建 立 p 个指标的线性判别函数,把待判样品代入线性 判别函数,然后与临界值比较,就可判样品属于哪 个类。 (三)Bayes 判别法的基本思想:对多个总体 (类)要求有一定的认识,利用借 Bayes 公式计算 样品到每个总体(类)的概率,比较概率的大小, 样品到那个总体(类)的概率最大,就判样品属于 哪个总体(类) 。 1.因子分析的基本思想:把每个研究变量分解为几个影响因素

14、变量, 将每个原始变量分解成两部分因素,一部分是由所 有变量共同具有的少数几个公共因子组成的,另一 部分是每个变量独自具有的因素,即特殊因子。 2.主成分分析分析与因子分析的联系和差异:联系:(1)因子分析是主成分分析的推广, 是主成分分析的逆问题。 (2)二者都是以降维为 目的,都是从协方差矩阵或相关系数矩阵出发。区别:(1)主成分分析模型是原始变量的线 性组合,是将原始变量加以综合、归纳,仅仅是变 量变换;而因子分析是将原始变量加以分解,描述 原始变量协方差矩阵结构的模型;只有当提取的公 因子个数等于原始变量个数时,因子分析才对应变 量变换。 (2)主成分分析,中每个主成分对应的系 数是唯

15、一确定的;因子分析中每个因子的相应系数 即因子载荷不是唯一的。 (3)因子分析中因子载荷 的不唯一性有利于对公因子进行有效解释;而主成 分分析对提取的主成分的解释能力有限。 3.因子载荷矩阵求解的方法: (1)基于主成分模型的主成分分析法 (2)基于因子分析模型的主轴因子法(3)极大似 然法(4)最小二乘法 (5)因子提取法 (6)映象分析法 4.因子分析的基本步骤: (1)因子分析的前提条件鉴定(2)因子提取(3)因子旋转(4)计算因子得分5 因子载荷阵的估计方法 (1)基于主成分模型的主成分分析法 Principal (2)基于因子分析模型的主轴因子法 Principal axis fac

16、toring 6 主成分分析概念及几何意义 概念(思想):主成分分析就是设法将原来指标 重新组合成一组新的互相无关的几个综合指标来代 替原来指标。同时根据实际需要从中可取几个较少 的综合指标尽可能多地反映原来的指标的信息 几何意义:主成分分析的过程也就是坐标旋转的过程,各主 成分表达式就是新坐标系与原坐标系的转换关系, 新坐标系中各坐标轴的方向就是原始数据方差最大 的方向。 7.聚类分析的基本思想: 是根据一批样品的多个观测指标,具体地 找出一些能够度量样品或指标之间相似程度的统计 量,然后利用统计量将样品或指标进行归类。把相 似的样品或指标归为一类,把不相似的归为其他类。 直到把所有的样品(或指标)聚合完毕. 8 系统聚类的基本思想是:距离相近的样品(或变 量)先聚成类,距离相远的后聚成类,过程一直进 行下去,每个样品(或变量)总能聚到合适的类中。系统聚类过程是:假设总共有 n 个样品(或变量) , 第一步将每个样品(或变量)独自聚成一类,共有

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号