魏宗舒版《概率论与数理统计教程》第三版课后习题

上传人:宝路 文档编号:48276217 上传时间:2018-07-12 格式:PPT 页数:20 大小:911.43KB
返回 下载 相关 举报
魏宗舒版《概率论与数理统计教程》第三版课后习题_第1页
第1页 / 共20页
魏宗舒版《概率论与数理统计教程》第三版课后习题_第2页
第2页 / 共20页
魏宗舒版《概率论与数理统计教程》第三版课后习题_第3页
第3页 / 共20页
魏宗舒版《概率论与数理统计教程》第三版课后习题_第4页
第4页 / 共20页
魏宗舒版《概率论与数理统计教程》第三版课后习题_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《魏宗舒版《概率论与数理统计教程》第三版课后习题》由会员分享,可在线阅读,更多相关《魏宗舒版《概率论与数理统计教程》第三版课后习题(20页珍藏版)》请在金锄头文库上搜索。

1、 数学的一个重要任务是从数量方面分析、揭示、表达现实世界 中普遍地存在着的变量之间的关系。一般来说,变量之间的关系 可分为两类:1. 确定性的函数关系:已知一个(或几个)变量的值,就可以 精确地求出另一个变量的值。如 V = 4/3R3,S = V t2. 非确定性的相关关系:几个变量之间存在着密切的关系,但 不能由一个(或几个)变量的值精确地求出另一个变量的值。在 相关关系中至少有一个变量是随机变量。如人的血压与年龄,环 境因子与农作物的产量,树木的直径与高度,人均收入与商品的 销量,商品的价格与消费者的需求量。回归分析是研究变量之间的相关关系的一种统计方法。回归( regression)这

2、一术语是1886年高尔顿(Galton)研究遗传现象 时引进的。本章仅简单介绍一元线性回归分析和多元线性回归分析。8.2 回归分析例1 以家庭为单位,某商品年需求量与其价格之间的调查数 据如下: 价格x(元) 1 2 2 2.3 2.5 2.6 2.8 3 3.3 3.5 需求量y(500g) 5 3.5 3 2.7 2.4 2.5 2 1.5 1.2 1.21. x与y之间是相关关 系,不能用解析表达式 y = f(x) 表示。2. 作散点图。发现这 些点分布在一条直线附 近。一元线性回归yi=0+1xi+ i (i =1,2,n)3. 把y 看成是由两部分叠加而成:一是x的线性式0+1x;

3、二是由随机因素引起的误差 。于是有y =0+1x+ (1) 假定i 相互独立,且 i N(0, 2) 。称(1)式为线性回归的数学模型。4. 为估计未知参数0 、1,将观测值(xi,yi)代入得称它们为正规(正则)方 程。解正规方程得选取bi使残差平方和Q最小:则即记则一、0,1的最小二乘估计设 b0 ,b1分别为0,1的估计值,即整理得记则得到经验回归方程但当假定y =0+1x+ 不成立时,求得的经验回归方程 是无意义的。所以,要检验 “y与 x 存在线性关系” 这一假设。实际上,对任何一组数据都可 以用上述方法配一条直线。因此 ,必须判断y与x 是否真的存在线 性相关关系。欲检验假设 H0

4、: 1= 0 0SRSe于是总平方和剩余平方和回归平方和当 F F(1,n-2)时,拒绝H0二、回归问题的统计检验即 Syy = SR + Se 相关系数R(样本相关系数)t 检验: t(n-2 ),当 t t(n-2) 时拒绝H0查相关系数表得临界值R(n-2),当 |R| R(n-2) 时拒绝H0查F分布表得临界值F(1, n-2),当 F F(1, n-2) 时拒绝H0三、预报和控制所谓预报问题,就是问当x=x0时y应取何值。很自然地想到用来预报y的真实值y0=0+1x0+,由于y是随机变量,给出y0的区 间估计更为合理。通常是在一定的置信度1-下,给出y0的容许 限或y0的预报区间。不

5、难证明,当一元线性回归的基本假定成立时,统计量其中,为的估计。因此,得到的置信度为1-的预报区间为2将曲线问题线性化本节主要介绍一元线性回归分析中将曲线问题线性 化的方法,本节涉及的几条曲线都是初等数学中的常 见曲线,无复杂和困难的地方,故本节内容让同学们 自学,不再赘述。值得注意的是,模型 y=0+1x+2x2+ pxp 是所谓的多项式回归,令 x1=x, x2=x2, xp=xp, 则有 y=0+1x+2x2+ pxp这就是10.3中要介绍的多元线性回归问题。 一、多元线性回归的数学模型将n次观测数据(xi1,x12,xip,yi),i=1,2,n代 入上面的方程,可得多元线性回归的数学模

6、型:设因变量y与p个自变量x1,xp之间有线性关系 :假定1,2,n相互独立,且服从同一正态分布N(0,2)。 其中为随机变量,称为随机误差。3 多元线性回归二、回归系数的最小二乘估计这里ei是i的估计值,仍称为残差或剩余。令 为yi的估计值, 即类似于一元线性回归,对i进行最小二乘估计是要选取bi , 使残差平方和Q达到最小。故得正规方程从正规方程解出b1,b2,bp, 再求出b0, 得经验回归方程:假设由某种方法得到0, 1, , p的估计值b0, b1, , bp则y的观 测值可表示为即三、回归方程和回归系数的显著性检验Syy为总平方和SR为回归平方和Se为剩余平方和当 H0成立时 1

7、. 回归方程的显著性检验检验多元线性回归方程是否显著,就是检验y与x1,x2,xp,中的某些自变量之间是否有较密切的线性关系。检验假设为 H0:1=2=p=0回归方程显著并不意味着每个自变量xi对y的影响都重要。若想从回归方程中剔除那些可有可无的变量,重新建立更为简单 有效的回归方程。就要检验xj对y的影响是否显著。统计假设为 H0 j : j=0,1jp当假设H0成立时,统计量服从自由度(1, n-p-1)的F的分布。若FjF,则拒绝假设H0,认为xj是重要的,应保留在回归 方程中;若FjF ,则认为变量xj可以从回归方程中剔除。2. 回归系数的显著性检验复相关系数R描述了y与x1,x2,x

8、p之间的线性相关程度 。显然,R2表示SR在Syy中所占的比例。一般情况下,R越大, 表明y与自变量间的相关性越好。通常,也将R作为回归方程显 著性检验的统计量。Ri表示在p个自变量中,除去其它p-1个自变量的影响外,xi与 y的相关程度。(1)复相关系数注意:R的大小与n和p有关,当n相对于p并不很大时,常 有较大的R。特别当n=p+1时,总有R=1。一般认为n为p的510 倍比较合适。(2)偏相关系数3. 相关系数下面的例题说明了对方程及变量进行统计检验的重要性,以及在剔除变量后变量显著性的变化。例2 卫生陶瓷用量y与城镇楼房住宅建筑面积x1,医疗卫生机构建筑面积x2,办公室建筑面积x3有

9、关。为预测未来卫生陶瓷用量,收集了20组有关数据。(1) 试建立y关于x1,x2,x3的回归方程;(2) 对回归方程和各自变量进行显著性检验;(3) 剔除不显著的变量后重新建立回归方程,直至方程和所有自变量均显著。 序号x1x2x3y 19.001.402.904.00 29.001.102.806.00 310.001.103.104.00 417.001.004.103.00 516.001.105.005.00 618.001.404.507.00 710.000.801.8010.00 89.000.400.604.00 99.000.500.805.00 1010.000.902.1

10、07.00 1112.001.102.1011.00 1214.002.204.008.00 1319.002.204.009.00 1421.002.403.6010.00 1520.002.204.2014.00 1622.002.304.6018.00 1721.002.104.0020.00 1828.002.304.3024.00 1933.002.404.7022.00 2050.002.606.0026.00解 依公式(10.23)和(10.24),有 于是得到正规方程解得再算出于是得到回归方程Syy=1008.55,SR=803.8157,Se=204.7344,F=20.93

11、94,F1=18.021,F2=5.780,F3=4.458。 查表得F0.05(3, 16)=3.24,F0.05(1, 16)=4.49。由于,故认为所建回归方程是显著的,又因为F1F0.05(1,16), F2F0.05(1,16) , F3F0.05(1,16) , 故在显著性水平下=0.05下,x1, x2是显著的。x3的作 用不明显,应剔除。再用x1, x2重新建立回归方程,得到F=24.248,F1=11.386,F2=2.097。经检验回归方程 及变量显著,但x2不显著。剔除x2 ,直接建立y与x1 的 回归方程,得到由回归方程看出,x3为负影响,但不能认为由于办公室建筑面积的增加,会造成卫生陶瓷需要量的减少 。 x3之所以成为负影响,说明x3与x1, x2有较密切的相关性,办公室面积的扩大受到住宅建筑面积和医疗 卫生机构建筑面积扩大的制约和影响。不难证明,F统计量与复相关系数R间具有关系:F=43.7351,回归方程极显著。因此,F检验和复相关系数检验的效果是完全一样的 。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号