《何晓群版应用回归分析考试重点题型.doc》由会员分享,可在线阅读,更多相关《何晓群版应用回归分析考试重点题型.doc(16页珍藏版)》请在金锄头文库上搜索。
1、一元,多元线形回归分析:一. 请分别叙述变量间统计关系与函数关系的区别,以及相关分析与回归分析的联系与区别。 答:各自然现象或社会现象之间普遍存在着各种联系,根据这些联系的紧密程度不同,可将之分为函数关系与统计关系。 一种情况下某变量Y能被其余的一类变量完全决定,这时两者之间存在着完全的确定性关系,这种关系可以通过一个函数 表示。这样的确定性关系被称为函数关系。 另一种情况下变量之间虽然存在紧密的联系,但并不能互相唯一确定,这种非确定性的紧密联系被称为统计关系。 相关分析与回归分析都是研究两边统计关系的方法,在实际问题的处理中往往结合使用两者。两者的区别主要在于:1.目标不同:相关分析主要用于
2、刻画X,Y两变量间的联系的密切程度,而回归分析除此之外,还关心对未观察Y值的预测与控制。2.角度不同:相关分析中X,Y两变量地位相同,因此假设两者都是随机变量;而回归分析中只将变量Y作为主要研究对象,因而往往假设Y是随机变量,而X是非随机变量。 二. 请叙述(一元)多元线性回归模型及其基本假设 答:1.一元线性模型的基本形式是: ,其中称为回归系数,称为随机误差。 其基本假设为: G-M假设: 或者更强的正态性假设: 独立同分布, 。 2.多元线性模型的基本假设是: 称为回归系数阵,称为随机误差. 其基本假设为: a. G-M假设: 或者更强的正态性假设: 独立同分布, 。 b.rank(X)
3、=p+115),可以简化为。 3. 在未观测点处,的区间估计为(置信区间) 。3. 给定置信上界与置信下界时,的取值范围为 七.叙述样本数据与回归系数标准化的意义与方法 答:多元线性回归模型中,由于自变量的数量级差异较大,因而舍入误差将对估计的精度造成较大的影响;同时自变量的单位不同也会造成回归方程的解释比较困难,因而通常需要对样本数据进行预处理,即数据的标准化。 数据的标准化通常这样进行: 利用标准化样本数据的得到的回归方程系数称为标准化回归系数,其满足: .八.给出偏决定系数、偏相关系数的定义 答:1.当其余自变量固定时,对y的影响程度称为的偏决定系数,定义为 2. 当其余自变量固定时,与
4、的相关程度称为两者的偏相关系数,定义为 。计算:1. (20分)近来某时尚杂志进行了一项关于高清数字电视的调查。对于各不同品牌不同型号的数字电视,该杂志基于画面质量给出了一个测试总分(i=1,2,24),同时,该杂志也收集了这些数字电视的平均市场售价。数据显示假设样本数据符合正态性假设,随机项的方差为。根据以上条件,请(1)(5分)建立y关于x的一元线性回归方程(2)(5分)给出作的无偏估计。(3)(5分)在的显著性水平下,检验变量之间的显著性。(已知:)(4)(5分)假设某种新上市的数字电视的评分为45分,请给出其市场建议价,并作该价格的置信水平为95%的区间估计。解:(1)根据题意,有:
5、-1分 -1分 -1分 从而所以回归方程为 -2分(2) -3分所以 -2分 (3)建立假设为: -1分 构造检验统计量: -3分 由于,所以拒绝原假设 -1分 即认为变量之间存在显著的线性关系。 (4)的估计值为 -1分 由于样本量较大,所以可以用近似公式计算预测区间 -1分 即价格的预测区间为 -3分 2.(15分)某市最近进行的一项有关公共交通的调查发现,公交车的维护费用与其已使用月数之间的关系可以用一元线性回归模型描述,其误差项满足,其中随机项满足G-M假设。实验的实际观测数据(10组)由下表给出,请根据数据给出该回归模型的估计,并预测某辆已使用了4年的公交车的维护费用。已使用月数61
6、454855294360 维护费用4968631751985048918256964858652931831945716887解:由于误差项满足,而满足G-M假设,所以可以通过差分法来消除自相关性。 -1分 对原样本数据做一阶差分,得到差分数据样本自变量差分-1637-2614175因变量差分1349-1119-1504134-3486-8383461-362 -37482316-4分由于差分数据必然已中心化,所以差分回归模型为 ,其中 -4分 从而回归方程为 -4分 将带入上述方程,得: -2分3.非参数检验(异方差)证明:1.对一元线性模型证明三种检验统计量等价证:对于一元线性回归模型来说
7、,F检验、t检验、相关性检验的原假设与备择假设相同,均为 -2分 而三者的检验统计量分别为:,。 -1分 由各参数的定义 -3分 所以 -2分 -2分 所以,即三种检验完全等价。2. 在正态性假设下,求证 (一元)/ (多元)是的无偏估计a. 记,则。再记。则 -4分 -4分 所以 -2分 从而 -5分 即是的无偏估计,证毕。b. 记. 则. -1分 从而 -2分 由正态性假设, -3分 -4分 从而 -1分 -3分所以是 的无偏估计 -1分3计算多元线性模型下,的期望阵与方差4. 证明数据标准化后参数估计值之间的转化关系5.证明dw的取值范围(0=dw=4) -2分 -2分样本充分大时,可以认为 -1分从而 -3分所以 -1分又,从而 其余:一叙述全模型、选模型的优缺点 答:设全模型为,选模型为(pm).那么:1.