多元统计思考题及答案

上传人:夏** 文档编号:543935995 上传时间:2023-05-08 格式:DOC 页数:13 大小:73KB
返回 下载 相关 举报
多元统计思考题及答案_第1页
第1页 / 共13页
多元统计思考题及答案_第2页
第2页 / 共13页
多元统计思考题及答案_第3页
第3页 / 共13页
多元统计思考题及答案_第4页
第4页 / 共13页
多元统计思考题及答案_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《多元统计思考题及答案》由会员分享,可在线阅读,更多相关《多元统计思考题及答案(13页珍藏版)》请在金锄头文库上搜索。

1、多元记录分析思考题第一章 回归分析1、回归分析是如何的一种记录措施,用来解决什么问题?答:回归分析作为记录学的一种重要分支,基于观测数据建立变量之间的某种依赖关系,用来分析数据的内在规律,解决预报、控制方面的问题。2、线性回归模型中线性关系指的是什么变量之间的关系?自变量与因变量之间一定是线性关系形式才干做线性回归吗?为什么?答:线性关系是用来描述自变量与因变量y的关系;但是反过来如果自变量与因变量不一定要满足线性关系才干做回归,因素是回归方程只是一种拟合措施,如果自变量和因变量存在近似线性关系也可以做线性回归分析。3、实际应用中,如何设定回归方程的形式?答:一般分为一元线性回归和多元线性回归

2、,随机变量y受到p个非随机因素x、x2、x3x和随机因素的影响,形式为: 是p个未知参数,是随机误差,这就是回归方程的设定形式。4、多元线性回归理论模型中,每个系数(偏回归系数)的含义是什么?答:偏回归系数是+1个未知参数,反映的是各个自变量对随机变量的影响限度。5、经验回归模型中,参数是如何拟定的?有哪些评判参数估计的记录原则?最小二乘估计法有哪些记录性质?要想获得抱负的参数估计值,需要注意某些什么问题?答:经验回归方程中参数是由最小二乘法来来估计的;评判原则有:一般最小二乘法、岭回归、主成分分析、偏最小二乘法等; 最小二乘法估计的记录性质:其选择参数满足正规方程组, (1)选择参数分别是模

3、型参数的无偏估计,盼望等于模型参数; (2)选择参数是随机变量的线性函数 要想获得抱负的参数估计,必须注意由于方差的大小表达随机变量取值的波动性大小,因此自变量的波动性可以影响回归系数的波动性,要想使参数估计稳定性好,必须尽量分散地取自变量并使样本个数尽量大。6、理论回归模型中的随机误差项的实际意义是什么?为什么要在回归模型中加入随机误差项?建立回归模型时,对随机误差项作了哪些假定?这些假定的实际意义是什么?答:随机误差项的引入使得变量之间的关系描述为一种随机方程,由于因变量y很难用有限个因素进行精确描述阐明,故其代表了人们的结识局限而没有考虑到的偶尔因素。、建立自变量与因变量的回归模型,与否

4、意味着她们之间存在因果关系?为什么?答:不是,因果关系是由变量之间的内在联系决定的,回归模型的建立只是一种定量分析手段,无法判断变量之间的内在联系,更不能判断变量之间的因果关系。8、回归分析中,为什么要作假设检查?检查根据的记录原理是什么?检查的过程是如何的?答:由于虽然我们已经建立起了模型,但是尚且不知这个回归方程与否可以比较好地反映所描述的变量之间的影响关系,必须进行记录学上的假设检查; 假设性检查原理可以用小概率原理解释,一般觉得小概率事件在一次实验中几乎不也许发生的,即对总体的某个假设是真实的,那么不支持这一种假设事件在一次实验中是几乎不也许发生的,要是这个事件发生了,我们就有理由怀疑

5、这一假设的真实性,回绝原假设; 检查过程:(1)提出记录假设0和;(2)构造一种与H0有关的记录量,称其为检查记录量;()根据其明显性水平的值,拟定一种回绝域;(4)作出记录决断;、回归诊断可以大体拟定哪些问题?回归分析有哪些基本假定?如果实际应用中不满足这些假定,将也许引起如何的后果?如何检查实际应用问题与否满足这些假定?对于多种不满足假定的情形,分别采用哪些改善措施?答:回归诊断解决: (1)回归方程的线性假定; ()与否存在多重共线性; (3)误差项的正态性假定; (4)误差项的独立性假设; ()误差项同方差假定; (6)与否存在数据异常; 原基本假定H: ()假设回归方程不明显; (2

6、)假设回归系数不明显; 引起后果:与模型误差相比,自变量对因变量的影响是不重要的(模型误差太大、自变量对的影响的确太小)。 如何检查:用F记录量或者值法来检查方程的明显性; 改善措施: (1)对于模型的误差太大,我们要想措施缩小误差,检查与否漏掉了重要的自变量,或检查自变量与y的非线性关系; ()对于自变量对影响较小,此时应当放弃回归分析措施。 10、回归分析中的R有何意义?它能用来衡量模型优劣吗?答:R2是回归平方和与总离差平方和之比,作为评判一种模型拟合度的原则,称为样本决定系数,其值越接近1,意味着模型的拟合优度越高。但是其不是衡量模型优劣唯一原则,增长自变量会使得自由度减少,因此需要引

7、入自由度修正的复有关系数。这些都需要视具体的状况而定。 11、如何拟定回归分析中变量之间的交互作用?存在交互作用时,偏回归系数的意义与不存在交互作用的情形下与否相似?为什么?答:交互作用是指因素之间联合搭配对实验指标的影响作用,存在交互作用是,偏回归系数肯定与不存在是的系数不同,毕竟变量之间有互相影响的关系。12、有哪些拟定最优回归模型的准则?如何选择回归变量?答:(1)修正的复有关系数达到最大; (2)预测平方和达到最小; ()定义Cp记录量值小,选择小的回归方程; (4)赤池信息量达到最小; 按照以上准则进行回归变量的选择。13、在如何的状况下需要建立原则化的回归模型?原则化回归模型与非原

8、则化模型有何关系?形式有否不同?答:在多元线性回归分析中,由于波及到的变量量纲不同,差别很大,需要对变量进行中心化和原则化,数据中心化解决相称于将坐标原点移至样本中心坐标系的平移不变化直线的斜率;原则化解决后建立的回归方程模型比非原则化的回归方程少一种常数项,系数存在关系。14、运用回归措施解决实际问题的大体环节是如何的?答:(1)根据预测目的,拟定自变量和因变量; (2)建立回归预测模型; (3)进行有关分析; (4)检查回归预测模型,计算预测误差; (5)计算并拟定预测值。5、你可以运用哪些软件实现进行回归分析?能否解释所有的软件输出成果?答:目前会用的软件是SPSS和matla,有关地球

9、物理的软件如graphe也可以进行回归分析。对于SPSS的某些输出成果,还是不太理解。第二章 鉴别分析、鉴别分析的目的是什么?答:在自然科学和社会科学研究中,研究对象用某种措施已经划分为若干类别,当得到一种新的样本数据时,要拟定该样本属于已知的哪一类。2、有哪些常用的鉴别分析措施?这些措施的基本原理或环节是如何的?它们各有什么特点或优劣之处?答:(1)距离鉴别法:根据已知分类数据,分别计算各类的重心,即是分类的均值;鉴别措施是对于任意一种样品,若它与第i类的重心距离近来,就觉得它来自第i类;特点是对各类数据分布并无特定的规定 (2)Fishr鉴别法:其基本思想是投影,将k组元数据投影到某一种方

10、向,使得投影后组与组之间尽量分开,其中运用了一元方差分析的思想导出鉴别函数;其特点是对总体的分布没有特殊规定,是解决概率分布未知的一种措施。 (3)逐渐鉴别法:逐渐引入一种“最重要”的变量进入鉴别式,同步对先引入鉴别式的某些变量进行检查,如果鉴别能力随着引入新变量而变得不明显,则将它从鉴别式中剔除,直到没有新的变量可以进入,仍然没有旧变量需要剔除为止。3、鉴别分析与回归分析有何异同之处?答:(1)相似点:这两种措施均有有关数据预测的功能; 不同点:这个估计太多了,一般来讲鉴别分析功能是将样品归类,回归分析是探究样品对因变量的变动影响。、鉴别分析对变量与样本规模有何规定?答:鉴别分析对总体分布没

11、有规定,但是鉴别分析的假设之一是规定每一种变量不能是其她鉴别变量的线性组合,即不能存在多重共线性。5、如何度量鉴别效果?有哪些影响鉴别效果的因素?答:通过评价鉴别准则来度量鉴别效果,常用措施: (1)误判率回代法; (2)误判率交叉确认估计; 影响因素是个总体之间的差别限度,各个总体之间差别越大,就越有也许建立有效的鉴别准则,如果差别太小,则鉴别分析的意义不大;当各个总体服从多元正态分布,我们可以根据各总体的均值向量与否相等进行记录检查。固然也可以检查各总体的协方差矩阵与否相等来采用鉴别函数。6、逐渐鉴别是如何选择鉴别变量的?基本思想或环节是什么?答:在鉴别分析中,并不是观测变量越多越好,而是

12、选择重要变量进行鉴别分析,将各个变量在分析中起的不同作用,将影响力比较低的变量保存在鉴别式中,会增长干扰,影响效果。因此选择明显鉴别力的变量来建立鉴别式就是逐渐鉴别法。 基本思想:其与逐渐回归法类似,都是采用“有进有出”的算法,即逐渐引入一种“最重要”的变量进入鉴别式,同步对先引入的鉴别式进行检查,如果其鉴别能力随着新引入的变量明显性减少,则该因素应当被剔除,直到变量所有进入为止。、鉴别分析有哪些现实应用?举例阐明。答:鉴别分析在实际中的应用无处不在。 例如我们根据多种经济指标把各个国家分为发达国家和发展中国家,通过这些指标成功的鉴定了一种国家的经济发展水平。第三章 聚类分析1、 聚类分析的目

13、的是什么?与鉴别分析有何异同?这种措施有哪些局限或欠缺?答:把某些方面相似的东西进行归类,以便从中发现规律性,达到结识客观事物规律的目的。 其与鉴别分析相似的地方是都是研究分组的问题;不同的是各自对于预先分组对象不同样,聚类分析是未知类别,鉴别分析是已知类别。2、 有哪些常用的聚类记录量?答:()Q型记录量:对样本进行聚类,用“距离”来描述样本之间的接近限度; 型记录量:对变量进行聚类,用“相似系数”来度量变量之间的近视限度。3、 系统(谱系)聚类法的基本思想是如何的?它涉及哪些具体措施?答:先将待聚类的n个样品(或变量)各自当作一类,共有类,然后按照事先选定的聚类措施计算每两类之间的聚类记录

14、量,即某种距离(或者相似系数),将关系最密切的两类并为一类,其他不变,即的n-1类,再按照前面的计算措施计算新类与其她类之间的距离(或者相似系数),再将关系最密切的两类归为一类,其他不变,即得n-2类,继续下去,每次反复都减少一类,直到所有样品(或者变量)都归于一类。4、 聚类分析对变量与样本规模有何规定?有哪些因素影响分类效果?要想减少不利因素的影响,可以采用哪些改善措施?答:聚类分析规定其样本规模较大,需要变量之间有关性较弱,变量个数不不小于样本数。5、 实际应用问题,如何拟定分类数目?答:按理来说聚类分析的分类数目是事先不懂得的,但是在实际应用中,应当根据有关专业知识拟定分类数目,结合聚

15、类记录量参照拟定,并使用误鉴定理具体分析。6、 迅速聚类法(K均值法)的基本思想或环节是如何的?答:如果待分类样品比较多,应先给出一种大概的分类,然后不断对其进行修正,始终到分类成果比较合理为止。7、 有序样品的最优分别法的基本思想或环节是如何的?答:将个样品当作一类,然后根据分类的误差函数逐渐增长分类,谋求最优分割,用分段的措施找出使组内离差平方和最小的分割点。8、 应用聚类分析解决实际问题的基本环节是如何的?应当注意哪些方面的问题?答:(1)n个变量(样品)各自成一类,一共有n类,计算两两之间的距离,构成一种对称矩阵; (2)选择这个对称矩阵中主对角元素以外的上(或者下)三角部分中的最小元素,合成的新类,并计算其与其她类之间的距离; (3)划去与新类有关的行和列,将新类与其他类别的距离构成新的n-1阶对称矩阵; (4)再反复

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号