396编号统计学课后题

上传人:玩*** 文档编号:145835877 上传时间:2020-09-23 格式:PDF 页数:7 大小:197.95KB
返回 下载 相关 举报
396编号统计学课后题_第1页
第1页 / 共7页
396编号统计学课后题_第2页
第2页 / 共7页
396编号统计学课后题_第3页
第3页 / 共7页
396编号统计学课后题_第4页
第4页 / 共7页
396编号统计学课后题_第5页
第5页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《396编号统计学课后题》由会员分享,可在线阅读,更多相关《396编号统计学课后题(7页珍藏版)》请在金锄头文库上搜索。

1、第二章 均值向量和协方差阵的检验 1、 试谈试谈 willks 统计量在多元方差分析中的重要意义。统计量在多元方差分析中的重要意义。 2、 形象分析的基本思路是什么?形象分析的基本思路是什么? 形象又称轮廓图, 是将总体样本的均值绘制到同一坐标轴里所得的折线图, 每一个指标 都表示为折线图上的一点。形象分析是将两(多)总体的形象绘制到同一个坐标下,根据形 象(轮廓图)的形状对总体的均值进行比较分析。 第三章 聚类分析 1、聚类分析的基本思想和功能是什么?、聚类分析的基本思想和功能是什么? 聚类分析的核心思想是根据具体的指标(变量)对所研究的个体或者对象进行分类,使 得同一类中的对象之间的相似性

2、比其他类的对象的相似性更强。 聚类分析不仅可以用来对样 品进行分类,也可以用来对变量进行分类。对样品的分类常称为 Q 型聚类分析,对变量的 分类常称为 R 型的聚类分析。 聚类分析的目的或功能就是把相似的研究对象归成类, 即使类间对象的同质性最大化和 类与类间对象的异质性最大化。 2、试述系统聚类法的原理和具体步骤、试述系统聚类法的原理和具体步骤 (1)系统聚类的基本思想是 : 距离相近的样品(或变量)先聚成类,距离相远的后聚成类, 过程一直进行下去,每个样品(或变量)总能聚到合适的类中。 (2)系统聚类的具体步骤:假设总共有 N 个样品(或变量) 第一步:将每个样品(或变量)独自聚成一类,共

3、有 N 类; 第二步 : 根据所确定的样品(或变量)“距离”公式,把距离较近的两个样品(或变量)聚 合为一类,其他的样品(或变量)仍各自聚为一类,共聚成 N-1 类; 第三步:将“距离”最近的两个类进一步聚成一类,共聚成 N-2 类;。,以上步骤一 直进行下去,最后将所有的样品(或变量)全聚成一类。 3、试述、试述 K-均值聚类的方法原理均值聚类的方法原理 这种聚类方法的思想是把每个样品聚集到其最近形心(均值)类中。 首先随机从数据集中选取 K 个点作为初始聚类中心,然后计算各个样本到聚类中的距 离, 把样本归到离它最近的那个聚类中心所在的类。 计算新形成的每一个聚类的数据对象的 平均值来得到

4、新的聚类中心,如果相邻两次的聚类中心没有任何变化,说明样本调整结束, 聚类准则函数已经收敛。 4、试述模糊聚类的思想方法、试述模糊聚类的思想方法 模糊聚类分析是根据客观事物间的特征、亲疏程度、相似性,通过建立模糊相似关系对客观 事物进行聚类的分析方法。在模糊聚类中,每个样本不再仅属于某一类,而是以一定的隶属 度属于每一类。换句话说,通过模糊聚类分析,可得到样本属于各个类别的不确定性程度, 即建立起了样本对于类别的不确定性的描述,这样就更能准确地反映现实世界。 第四章 判别分析 1、应用判别分析应该具备什么样的条件?、应用判别分析应该具备什么样的条件? 判别分析最基本的要求是:分组类型在两组以上

5、;每组案例的规模必须至少在一个以上; 解释变量必须是可测量的,才能够计算其平均值和方差,使其能合理地应用于统计函数。 2、试述贝叶斯判别法的思路、试述贝叶斯判别法的思路 思想是 : 假定对研究的对象已有一定的认识,常用先验概率分布来描述这种认识,然后 我们取得一个样本,用样本来修正已有的认识(先验概率分布),得到后验概率分布,各种 统计推断都通过后验概率分布来进行。将贝叶斯思想用于判别分析,就得到贝叶斯判别。 3、试述费歇判别方法的思想。、试述费歇判别方法的思想。 费歇判别的思想是投影,将 K 组 P 维数据投影到某一个方向,使得它们的投影组和组 之间尽可能地分开。 4、什么是逐步判别分析、什

6、么是逐步判别分析 凡具有筛选变量能力的判别方法统称为逐步判别法。逐步判别法的基本思想是 : 逐步引 入变量,每次引入一个最重要的变量,同时也检验先前引入的变量,如果先前引入的变量 其判别能力随新引入变量而变不显著, 则及时将其从判别式中剔除, 直到判别式中的变量都 很显著,且剩下来的变量也没有重要的变量可引入判别式时,逐步筛选结束。 5、简要叙述判别分析的步骤及流程。、简要叙述判别分析的步骤及流程。 判别分析的 6 个步骤过程: (1)判别分析的对象 : 这一步骤主要根据判别分析的研究目的定义观测变量。(2)判别分 析的研究设计 : 主要包括解释变量和被解释变量的选择、估计判别函数所需的样本量

7、和为了 验证目的对样本的分割。(3)假定:推导判别函数的关键假定是解释变量的多元正态性和 被解释变量定义的各组的未知但相等的协方差结构。(4)估计判别模型和评估整体拟合: 研究者必须确定估计的方法,然后确定保留的函数个数 ; 根据估计的函数可用多种方法来评 估模型拟合。 (5) 结果的解释 : 这个过程主要介绍在判别分析中每个解释变量的相对重要性, 主要有标准化判别权重、判别载荷(结构相关系数)、偏 F 值三种方法确定重要性。(6) 结果的验证:通常采用分割样本或者交叉验证法。 判别分析的流程: 研究问题设计要点假定估计判别函数使用分类矩阵估计预测的精度判别函数的解释 判别结果的验证 第五章

8、主成分分析 1、主成分的基本思想是什么、主成分的基本思想是什么 在对某一事物进行实证研究中,为了更全面、准确地反映出事物的特征及其发展规律, 人们往往要考虑与其有关系的多个指标, 这些指标在多元统计中也称为变量。 这样就产生了 如下问题 : 一方面人们为了避免遗漏重要的信息而考虑尽可能多的指标,而另一方面随着考 虑指标的增多增加了问题的复杂性, 同时由于各指标均是对同一事物的反映, 不可避免地造 成信息的大量重叠, 这种信息的重叠有时甚至会抹杀事物的真正特征与内在规律。 基于上述 问题,人们就希望在定量研究中涉及的变量较少,而得到的信息量又较多。主成分分析正是 研究如何通过原来变量的少数几个线

9、性组合来解释原来变量绝大多数信息的一种多元统计 方法。 既然研究某一问题涉及的众多变量之间有一定的相关性, 就必然存在着起支配作用的 共同因素,根据这一点,通过对原始变量相关矩阵或协方差矩阵内部结构关系的研究,利用 原始变量的线性组合形成几个综合指标 (主成分), 在保留原始变量主要信息的前提下起到 降维与简化问题的作用,使得在研究复杂问题时更容易抓住主要矛盾。一般地说,利用主成 分分析得到的主成分与原始变量之间有如下基本关系: 1.每一个主成分都是各原始变量的线性组合; 2.主成分的数目大大少于原始变量的数目 3.主成分保留了原始变量绝大多数信息 4.各主成分之间互不相关 通过主成分分析,

10、可以从事物之间错综复杂的关系中找出一些主要成分, 从而能有效利 用大量统计数据进行定量分析, 揭示变量之间的内在关系, 得到对事物特征及其发展规律的 一些深层次的启发,把研究工作引向深入。 2、主成分在应用中的主要作用是什么?、主成分在应用中的主要作用是什么? 设法将原来变量重新组合成一组新的互相无关的几个综合变量, 同时根据实际需要从中 可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析 或称主分量分析,也是数学上用来降维的一种方法。 3、由协方差阵出发和由相关阵出发求主成分有什么不同?、由协方差阵出发和由相关阵出发求主成分有什么不同? 一般而言, 对于度量单位不

11、同的指标或是取值范围彼此差异非常大的指标, 我们不直接 由其协方差矩阵出发进行主成分分析,而应该考虑将数据标准化。但是,对原始数据进行标 准化处理后倾向于各个指标的作用在主成分的构成中相等。 对于取值范围相差不大或是度量 相同的指标进行标准化处理后, 其主成分分析的结果仍与由协方差阵出发求得的结果有较大 区别。 其原因是由于对数据进行标准化的过程实际上也就是抹杀原始变量离散程度差异的过 程,标准化后的各变量方差相等均为 1,而实际上方差也是对数据信息的重要概括形式,也 就是说, 对原始数据进行标准化后抹杀了一部分重要信息, 因此才使得标准化后各变量在对 主成分构成中的作用趋于相等。由此看来,对

12、同度量或是取值范围在同量级的数据,还是直 接从协方差矩阵求解主成分为宜。 第六章 因子分析 1、因子分析与主成分分析有什么本质不同?、因子分析与主成分分析有什么本质不同? 主成分分析和因子分析是两种把变量维数降低以便于描述、理解和分析的方法 : 实际上 主成分分析可以说是因子分析的一个特例。 (1)因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成 各个变量的线性组合。 (2)主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之 间的协方差。 (3)主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设 包括:各

13、个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同 因子和 特殊因子之间也不相关。 (4)主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分 一般是独特的;而因子分析中因子不是独特的,可以旋转得到不到的因子。 (5)在因子分析中,因子个数需要分析者指定(spss 根据一定的条件自动设定,只要是特 征值大于 1 的因子进入分析),而指 定的因子数量不同而结果不同。在主成分分析中,成 分的数量是一定的,一般有几个变量就有几个主成分。 (6)和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加 有 优势。大致说来,当需要寻

14、找潜在的因子,并对这些因子进行解释的时候,更加倾于使 用因子分析, 并且借助旋转技术帮助更好解释。 而如果想把现有的变量变成少数几个新的变 量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主 成分分析。 当然,这中情况也可以使用因子得分做到。所以这种区分不是绝对的。 2、因子载荷的统计定义是什么?它在实际问题分析中的作用是什么?、因子载荷的统计定义是什么?它在实际问题分析中的作用是什么? aij 因子载荷 a(ij)的统计意义就是第 i 个变量与第 j 个公共因子的相关系数即表示 X(i) 依赖 F(j)的份量(比重)。统计学术语称作权,心理学家将它叫做载荷,即表示第 i

15、个变 量在第 j 个公共因子上的负荷,它反映了第 i 个变量在第 j 个公共因子上的相对重要性。 在因子分析中, 通常只选其中 m 个(mp 主因子), 即根据变量的相关选出第一主因子1, 使其在各变量的公共因子方差中所占的方差贡献为最大, 然后消去这个因子的影响, 而从剩 余的相关中,选出与之不相关的因子,使其在各个变量的剩余因子方差贡献中为最大,如此 往复,直到各个变量公共因子方差被分解完毕为止。 第七章 对应分析 1、试述对应分析的思想方法及特点。试述对应分析的思想方法及特点。 思想:对应分析又称为相应分析,也称 RQ 分析。是因子分子基础发展起来的一种多 元统计分析方法。 它主要通过分

16、析定性变量构成的列联表来揭示变量之间的关系。 当我们对 同一观测数据施加 R 和 Q 型因子分析,并分别保留两个公共因子,则是对应分析的初步。 对应分析的基本思想是将一个联列表的行和列中各元素的比例结构以点的形式在较低维的 空间中表示出来。 它最大特点是能把众多的样品和众多的变量同时作到同一张图解上, 将样 品的大类及其属性在图上直观而又明了地表示出来,具有直观性。另外,它还省去了因子选 择和因子轴旋转等复杂的数学运算及中间过程,可以从因子载荷图上对样品进行直观的分 类,而且能够指示分类的主要参数(主因子)以及分类的依据,是一种直观、简单、方便的 多元统计方法。 特点 : 对应分析的基本思想是将一个联列表的行和列中各元素的比例结构以点的形式在 较低维的空间中表示出来。 它最大特点是能把众多的样品和众多的变量同时作到同一张图解 上,将样品的大类及其属性在图上直观而又明了地表示出来,具有直观性。另外,它还省去 了因子选择和因子轴旋转等复杂的数学运算及中间过程, 可以从因子载荷图上对样品进行直 观的分类,而且能够指示分类的主要参数(主因子)以及分类的依据,是一种

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 总结/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号