四、回归方程的应用及注意事项

上传人:创****公 文档编号:143142298 上传时间:2020-08-26 格式:PPT 页数:61 大小:2.07MB
返回 下载 相关 举报
四、回归方程的应用及注意事项_第1页
第1页 / 共61页
四、回归方程的应用及注意事项_第2页
第2页 / 共61页
四、回归方程的应用及注意事项_第3页
第3页 / 共61页
四、回归方程的应用及注意事项_第4页
第4页 / 共61页
四、回归方程的应用及注意事项_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《四、回归方程的应用及注意事项》由会员分享,可在线阅读,更多相关《四、回归方程的应用及注意事项(61页珍藏版)》请在金锄头文库上搜索。

1、四、回归方程的应用及注意事项,应用: 描述 (x和y的数量关系) 预测 (给定x值,估计y) 3. 控制 (控制x值来限定y的范围),注意事项: 要有意义 回归变量的确定 观测值要尽可能多 回归方程应进行检验 预测和外推要谨慎,五、SPSS实现,Statistics,Confidence intervals:回归系数b的95%置信区间,Save,Prediction intervls:预测区间估计, mean:自变量为定值时,预测值的均数的可信区间(lmci_1为下限,umic_1为上限); Individual:自变量为定值时,依变量的波动范围( lici_1为下限,uici_1为上限) C

2、onfidence: 置信度,输入自变量是x,R的平方称为判定系数,值越大,线性回归越好。,若想预测自变量为某一值时,y的范围,只需重复上面的步骤。,六、Origin实现,注意: 一定要先选中两列数据,再进行拟合,置信区间 预测区间,相关系数和决定系数 相关系数的假设检验 相关系数的区间估计 应用直线相关的注意事项,第二节 直线相关,回归 - 变量间的依存关系,相关 - 变量间的互依关系,线性相关(linear correlation):简单相关(simple correlation),用于双变量正态分布资料。,正相关,正相关,负相关,零相关,一、 相关系数,相关系数(correlation

3、coefficient),又称积差相关系数(coefficient of product moment correlation),或 Pearson 相关系数(软件、文献中常用此名称)。,相关的类型,正相关 负相关 完全正相关 完全负相关 称零相关,通常还需计算决定系数r2,表示相关程度,不能表示相关性质。,即表示变量 x 引起y变异的回归平方和占y变异总平方和的比率。,黏虫孵化历期平均温度与历期天数成负相关。,y的变异有93.74可用y与x二者之间的线性关系来解释。,【例7.8】求例7.1资料黏虫黏虫孵化历期平均温度与历期天数的相关系数和决定系数。,二、相关系数的假设检验,r0原因: 由于抽

4、样误差引起,总体相关系数=0 存在相关关系, 总体相关系数0,(1) 假设,(2) 显著性水平,(3) 检验,(4) 推断,H0:=0 ;HA:0,选取显著水平,在显著水平上,否定H0,接受HA;推断r显著。,在显著水平上,接受H0,否定HA;推断r不显著。,r经显著性检验的结果呈不显著时,便推断两变数间不存在相关关系,这时不能用r代表其相关密切程度。,() 假设,(2) 水平,(3) 检验,(4) 推断,H0:=0 ;HA:0,选取显著水平0.01,否定H0,接受HA;推断r极显著,黏虫孵化历期温度与历期天数之间存在着极显著的直线相关关系。,【例7.9】检验例7.8中所求相关系数的显著性。,

5、必然结果,r与t符号相同,相关系数的假设检验可不计算t值,直接从附表8查出df=n-2时r的临界值。,椰子树的产量数 x(个),椰子树的高度 y(尺),x (个) 120 121 123 126 128 y (尺) 21 23 22 25 24,椰子树的产果树与树高之间无直线相关关系。,当样本太小时,即使r值达到0.7996,样本也可能来自总体相关系数=0的总体。,不能直观地由r值判断两变数间的相关密切程度。,试验或抽样时,所取的样本容量n大一些,由此计算出来的r值才能参考价值。,1,2,三、总体相关系数 的区间估计,一般说来,当样本量较大(n100),并对r进行假设检验,有统计学意义时, 1

6、. r的绝对值大于0.7,则表示两个变量高度相关; 2. r的绝对值大于0.4,小于等于0.7时,则表示两个 变量之间中度相关; 3. r的绝对值大于0.2,小于等于0.4时,则两个变量 低度相关。,【例7.10】求例7.1资料中总体的95置信区间。,黏虫孵化历期温度与历期天数的总体相关系数的95的置信区间为(-0.9944,-0.8294)。,四、直线回归与相关的区别与联系,相关与回归的区别,1. 意义:回归:反映两个变量的依存关系 相关:反映一种双向变化的关系 2. 应用:回归:由一个变量值推算另一个变量值 相关:只反映两变量间互依关系,回归,相关,x是可以精确测量和严格控制的变量。,y服

7、从正态分布。,x服从正态分布。,y服从正态分布。,x,y,3. 资料:回归:y正态随机变量,x为选定变量 相关:x、y服从双变量正态分布 4. 相关系数无单位,回归系数有单位,相关与回归的联系,回归方程的显著性,回归系数的显著性,相关系数的显著性,一致,r:+,两变量间的相互关系是同向变化的。,b:+,x增(减)一个单位,y平均值增(减)b个单位。,三者同时显著或不显著。,r与b的符号一致,由两变量离均差乘积之和的符号决定。,y关于x的直线回归系数,x 关于y的直线回归系数,用回归解释相关,应用直线相关与回归的注意事项,1. 实际意义 进行相关回归分析要有实际意义,不可把毫无关系的两个事物或现

8、象用来作相关回归分析。 例如,有人说,孩子长,公园里的小树也在长。求孩子和小树之间的相关关系就毫无意义,用孩子的身高推测小树的高度则更加慌谬。,2. 相关关系 相关关系不一定是因果关系,也可能是伴随关系,并不能证明事物间有内在联系。不显著的相关系数只说明两变量间没有显著的直线相关关系。 例如,有人发现,对于在校儿童,鞋的大小与阅读技能有很强的相关关系。然而,学会新词并不能使脚变大,而是涉及到第三个因素 年龄。当儿童长大一些,他们的阅读能力会提高而且由于长大也穿不下原来的鞋。,3.利用散点图 对于性质不明确的两组数据,可先做散点图,在图上看它们有无关系、关系的密切程度、是正相关还是负相关,然后再进行相关回归分析。 4.变量范围 相关分析和回归方程仅适用于样本的原始数据范围之内,出了这个范围,我们不能得出两变量的相关关系和原来的回归关系。,5.直线相关分析时对变量的要求 直线相关分析的两个变量都应服从正态分布。否则,先正态化,再根据转换值分析相关性。 6.相关系数应进行检验 公式计算的只是样本的相关系数。 7.变量要尽可能多 =0的总体中所得r的抽样分布,在n5时才逐渐转给钟形近似正态分布。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号