两指标间的直线回归

上传人:德****1 文档编号:1087942 上传时间:2017-05-27 格式:PPT 页数:64 大小:819.50KB
返回 下载 相关 举报
两指标间的直线回归_第1页
第1页 / 共64页
两指标间的直线回归_第2页
第2页 / 共64页
两指标间的直线回归_第3页
第3页 / 共64页
两指标间的直线回归_第4页
第4页 / 共64页
两指标间的直线回归_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《两指标间的直线回归》由会员分享,可在线阅读,更多相关《两指标间的直线回归(64页珍藏版)》请在金锄头文库上搜索。

1、医学统计学,两指标间的直线回归 Linear regressionGJ 2008,直线回归分析内容提要,1 直线回归的概念2 直线回归方程的建立3 回归系数和回归方程的意义及性质4 回归系数的假设检验5 应变量总变异的分解6 回归问题的方差分析7 直线回归的区间估计8 两条回归直线的比较9 过定点的直线回归8 直线相关与回归的区别和联系9 回归分析的正确应用,Regression 释意,直线回归的概念,Y 应变量 (dependent variable, response variable) X 自变量 (independent variable, explanatory variable)

2、自变量影响应变量,或应变量依赖于自变量。,直线回归的概念,统计学上将分析某变量随另一变量变化而变化线性依存关系的方法称为直线回归(linear regression)。通过拟合线性方程来描述两变量间的回归关系。直线回归的形式:,直线回归的概念,表示按回归方程求得的估计值,指当X固定时,Y的总体均数 的估计值。 a为回归直线在Y轴上的截距,即X=0时 的值;a0:回归直线与纵轴的交点在原点上方;a0:Y随X的增加而增加,回归直线从左下方走向右上方;b0:Y随X的增加而减少,回归直线从左上方走向右下方;b=0:回归直线与X 轴平行,即X与Y无回归关系。 回归系数b的统计学意义:自变量X每改变一个单

3、位,应变量Y平均改变b个单位,直线回归方程的建立,最小二乘法(least square estimation),例、10名3岁男童体重与体表面积的关系,编号 体重(X,kg) 体表面积(Y,103cm2)111.0 5.283211.85.299312.05.358412.35.292513.15.602613.76.014714.45.830814.96.102915.26.075 1016.06.411 合计133.457.266,1、作散点图,体重(kg),X,体表面积Y(103cm2),5、绘制回归直线,在自变量X的实测范围内任取相距较远且易读数的两X值,代入直线回归方程求得两点(X1

4、, ),(X2, ),过这两点作直线即为所求回归直线。本例取X1=12,得 =5.3832;取X2=15, 得 =6.0987。注意点:避免直线外延。所作回归线一般不超过样本的自变量取值范围,本例应不超过1116(kg)。,10名3岁男童体重与体表面积的直线回归图,体重(kg),X,体表面积Y(103cm2),回归系数和回归方程的意义及性质,b的意义a的意义 的意义 的意义 的意义,1、b的意义,回归系数b称为斜率(slope)表示自变量增加一个单位时,应变量平均改变的量b=0.2385(103cm2/kg): 表示3岁男童的体重增加1(kg),则体表面积平均递增0.2385(103cm2 )

5、。直线回归与相关均表示两变量间的线性关系,b与r的正负号相同,假设检验也等价。,2、a的意义,a称截距(intercept),常数项(constant)X=0 时,Y的总体均数的估计值a的单位与Y值相同当X可能取0时,a才有实际意义在前面例子中,因3岁男童的体重不可能取0(kg),故a=2.5212(103cm2)没有实际意义。,3、 的意义,条件均数(conditional mean)表示给定X时Y的平均值的估计如X=12(kg)时,得 =5.3832(103cm2) 其意义是:所有体重为12(kg)的3岁男童,估计其平均体表面积为5.3832(103cm2)。性质:,由体重(kg)估计体表

6、面积(103cm2),X(体重,kg) Y (体表面积) Y 的估计值 11.0 5.283 5.14511.8 5.299 5.33612.0 5.358 5.38312.3 5.292 5.45513.1 5.602 5.64613.7 6.014 5.78914.4 5.830 5.95614.9 6.102 6.07515.2 6.075 6.14616.0 6.411 6.337,4、 的意义,为残差:Y的观察值与对应估计值之差(点到直线的纵向距离)。,所有残差之和为0。 直线上方的点到回归直线纵向距离之和直线下方的点到回归直线纵向距离之和。,残差平方和 (residual sum

7、of squares).综合表示点到直线的距离。在所有的直线中,回归直线的残差平方和是最小的,且唯一。(最小二乘),5、 的意义,回归系数的假设检验,抽样误差理论表明,即使从回归系数=0的总体中进行随机抽样,所得样本回归系数往往不等于0。建立的回归方程是否成立,即X与Y间是否有直线回归关系,必须进行假设检验。,回归系数的t检验,检验假设为: H0:总体回归系数0; H1:总体回归系数0。 =0.05。检验统计量t值的计算公式:,样本回归系数的标准误:剩余标准差:表示当X固定时,估计值 的变异。,体重与体表面积回归系数的假设检验,H 0:总体回归系数0,即体重与体表面积无回归关系 ;H 1 :总

8、体回归系数0,即体重与体表面积有回归关系 。 =0.05。,体重与体表面积之间有回归关系。,tb与tr的比较,tbtr回归系数是否为0的假设检验与相关系数是否为0的假设检验完全等价。实际工作中常用相关系数的假设检验代替回归系数的假设检验。理由:相关系数的假设检验计算相对简单。,应变量总变异的分解,X,P (X,Y),Y,Q,L,Y的总变异分解,未引进回归时的总变异: (sum of squares about the mean of Y)引进回归以后的变异(剩余): (sum of squares about regression)回归的贡献,回归平方和: (sum of squares du

9、e to regression),Y的总变异分解,回归问题的方差分析,H 0:体重与体表面积间无直线回归关系; H 1:体重与体表面积间有直线回归关系。 = 0.05。lXX=24.9040,lYY=1.5439,lXY=5.9396, SS总= lYY=1.5439SS剩 = lYY lXY2 / lXX=0.1273 SS回 = SS总-SS剩=1.5439-0.1273=1.4166,方差分析表,变异来源 SS v MS F P 总变异1.5439 9 回 归1.4166 1 1.4166 89.09 0.01 剩 余 0.1273 8 0.0159 3岁男童的体重与体表面积之间有线性回

10、归关系。,三种假设检验间的关系,在直线相关回归分析中,相关系数的假设检验,回归系数的假设检验,以及回归方程的方差分析结果等价。,直线回归的区间估计,总体回归系数的可信区间估计总体估计值 的可信区间估计个体Y值的容许区间估计,1.总体回归系数 的可信区间估计,经假设检验,认为X与Y间的回归关系成立,则可进一步估计总体回归系数 的100(1- )%可信限为: 如b=0.2385, sb=0.02528, =10-2=8,t0.05,8=2.306,故 的95%可信区间为: ( 0.1802,0.2968) (103cm2/kg),2. 的可信区间估计,样本 总体Y的总平均给定X时Y的平均 (Y的条

11、件均数),根据 t 分布原理:,X=12时,求 的95%可信区间 =13.44, lXX=24.9040, =0.1262。 当X=12时, =5.3832,,3. 个体Y值的容许区间估计,容许区间就是总体中当X固定时,个体Y值的波动范围。个体Y值的100(1- )%容许限:,X=12时,求个体Y值的95%容许限: =13.44, lXX=24.9040, =0.1262。 当X=12时, =5.3832,,的可信区间与Y的容许区间,X=12时, 的95%可信区间为:5.25875.5077(103cm2), 表示:体重为12kg的三岁男童,估计其平均体表面积为5.3832(103cm2),9

12、5%可信区间为(5.2587,5.5077) (103cm2)。 X=12时,Y的95%容许区间为:5.06665.6998(103cm2), 表示:体重为12kg的三岁男童,估计有95的个体的体表面积在5.06665.6998 之间。,的可信区间与Y的容许区间,可信区间是针对条件均数的,而容许区间是针对Y的取值范围的。前者表示在固定的X处,反复抽样100次,计算得100个相应总体条件均数的可信区间,理论上有100(1-)个可信区间包含了客观存在的总体条件均数;后者表示X固定时,预测值的取值范围,预测100个个体,平均有100(1-)的个体预测值分布在此范围之内。,可信区间与容许区间示意(co

13、nfidence band & tolerance band),两条回归直线的比较,在实际工作中,有时需要对两条回归方程进行比较,以推断相应的两总体回归直线是否平行,是否重叠。参数b和a两回归直线平行,等价于1=2;两回归直线重叠,等价于1=2且1=2。,进行两条回归直线比较的时候,首先应该检验斜率是否相等(1=2):1、如果相等,说明两条回归线平行,但还不能说明两条回归线重合,还须进一步检验两条回归线的截距是否相等。2、如果不等,无须进一步对截距进行检验。具体假设检验方法、公式、步骤见教材Page126-129。,过定点的直线回归,在某些特殊医学研究中应用直线回归时,要求所拟合的直线必须经过某一定点(X0,Y0)。光电比色分析荧光分析火焰光度测定同位素测定,过定点(X0,Y0)的直线回归方程,一般的直线回归方程(过X的均数和Y的均数):,过定点(X0,Y0)的直线方程估计,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号