《统计学 相关2010》由会员分享,可在线阅读,更多相关《统计学 相关2010(60页珍藏版)》请在金锄头文库上搜索。
1、第十三章 线性相关分析 ( linear correlation ),本 章 主 要 内 容,线性相关的概念 样本相关系数的计算 对相关系数的假设检验 相关系数的可信区间 线性相关分析的注意事项 线性相关分析与线性回归分析的区别和联系,内容回顾:第十二章 线性回归分析,线性回归分析的一般步骤:(1)绘制散点图;若点的分布有直线趋势,则 (2)根据样本数据计算回归方程 ; (3)检验总体回归系数 = 0;若 0,则 (4)利用回归分析结果。,?,线性相关( linear correlation) ,即直线相关,是分析两变量间有无直线相关关系的一种统计分析方法。,第一节 线性相关的概念,表13-1
2、 16名中年女性的体重指数( kg/m2 ) 和收缩压( kPa)的测量值,例13-1 为研究中年女性体重指数和收缩压之间的关系,随机测量了16名中年女性的体重指数和收缩压,试作线性相关分析。,一、散点图(scatter plot),图13-1 16名中年女性的体重指数和收缩压的散点图,(Y),( X ),图13-1 16名中年女性的体重指数和收缩压的散点图,(Y),( X ),图13-1 16名中年女性的体重指数和收缩压的散点图,(Y),( X ),图13-1 16名中年女性的体重指数和收缩压的散点图,(Y),( X ),可见,体重指数较大者,其收缩压值也较大,且呈直线趋势,该资料适宜作线性
3、相关分析。,二、相关系数的含义,相关系数(linear correlation coefficient)是描述两个随机变量之间线性相关关系的方向和密切程度的统计指标。总体相关系数用符号 表示,样本相关系数用符号r 表示;取值范围:-1 r 1 或 -1 1 。,相关系数 r 的取值及两变量间相关关系的直观图示:,正相关(0 r 1),Y,X,负相关(-1 r 0),完全正相关(r =1),完全负相关(r = -1),X,Y,Y,Y,X,X,相关系数 r 的取值及两变量间相关关系的直观图示:,零相关(r = 0),Y,X,Y,Y,Y,X,X,X,第二节 线性相关系数的计算,线性相关系数又称积差相
4、关系数, 简称pearson相关系数或相关系数。,Karl Pearson (1857-1936)England,相关系数可用来说明两变量间相关关系的方向和密切程度。,相关系数 r 的计算公式:,例13-2 计算表13-1中体重指数和收缩压的相关系数。,例13-2 计算表13-1中体重指数和收缩压的相关系数。 解: 1绘制散点图,观察两变量之间是否有线性趋势。,图13-1 16名中年女性的体重指数和收缩压的散点图,(Y),( X ),例13-2 计算表13-1中体重指数和收缩压的相关系数。 解: 1绘制散点图,观察两变量之间是否有线性趋势。,例13-2 计算表13-1中体重指数和收缩压的相关系
5、数。 解: 1绘制散点图,观察两变量之间是否有线性趋势。2计算相关系数。列表计算基本数据。,表13-1 16名中年女性的体重指数( kg/m2 )和收缩压( kPa)的测量值,10,第三节 相关系数的假设检验,假设检验的目的是推断总体相关系数 是否等于0 ?方法: t 检验法 查表法,检验统计量 t 的计算公式:, t 检验法,例13-3 根据例13-2 的样本相关系数,对总体相关系数 作假设检验。,例13-3 根据例13-2 的样本相关系数,对总体相关系数 作假设检验。解: 建立假设,确定检验水准。H0: = 0 (变量间不存在线性相关关系);H1: 0 (变量间有线性相关关系); = 0.
6、05,例13-3 根据例13-2 的样本相关系数,对总体相关系数 作假设检验。解: 建立假设,确定检验水准。H0: = 0 (两变量间不存在线性相关关系);H1: 0 (变量间有线性相关关系); = 0.05,例13-3 根据例13-2 的样本相关系数,对总体相关系数 作假设检验。解: 建立假设,确定检验水准。H0: = 0 (两变量间不存在线性相关关系);H1: 0 (两变量间有线性相关关系); = 0.05, 计算检验统计量。本例,n =16, r =0.9110,, 计算检验统计量。本例,n =16, r =0.9110, 查界值表,确定P 值,下结论。按 v=14 查 t 界值表, ,
7、 ,则P 0.01,按=0.05水准拒绝H0,接受H1,可认为体重指数和收缩压之间存在正相关关系。, 计算检验统计量。本例,n =16, r =0.9110, 查界值表,确定P 值,下结论。按 v=14 查 t 界值表, , ,则P 0.01,按=0.05水准拒绝H0,接受H1,可认为体重指数和收缩压之间存在正相关关系。, 计算检验统计量。本例,n =16, r =0.9110, 查界值表,确定P 值,下结论。按 v=14 查 t 界值表, , ,则P 0.01,按=0.05水准拒绝H0,接受H1,可认为体重指数和收缩压之间存在正相关关系。, 查表法, = 0.05r = 0.9110查 r
8、界值表,v =14 , , ,r r0.01/2,14 ,所以 P 0.01,按 水准拒绝H0,接受H1,可认为体重指数和收缩压之间存在正相关关系。, 查表法,H0: = 0 (两变量间不存在线性相关关系);H1: 0 (两变量间有线性相关关系); = 0.05r = 0.9110查 r 界值表,v =14 , , ,r r0.01/2,14 ,所以 P 0.01,按 水准拒绝H0,接受H1,可认为体重指数和收缩压之间存在正相关关系。, 查表法,H0: = 0 (两变量间不存在线性相关关系);H1: 0 (两变量间有线性相关关系); = 0.05r = 0.9110查 r 界值表,v =14
9、, , ,r r0.01/2,14 ,所以 P 0.01,按 水准拒绝H0,接受H1,可认为体重指数和收缩压之间存在正相关关系。, 查表法,H0: = 0 (两变量间不存在线性相关关系);H1: 0 (两变量间有线性相关关系); = 0.05r = 0.9110查 r 界值表,v =14 , , ,r r0.01/2,14 ,所以 P 0.01,按 水准拒绝H0,接受H1,可认为体重指数和收缩压之间存在正相关关系。, 查表法,H0: = 0 (两变量间不存在线性相关关系);H1: 0 (两变量间有线性相关关系); = 0.05r = 0.9110查 r 界值表,v =14 , , ,r r0.
10、01/2,14 ,所以 P 0.01,按 水准拒绝H0,接受H1,可认为体重指数和收缩压之间存在正相关关系。, 查表法,H0: = 0 (两变量间不存在线性相关关系);H1: 0 (两变量间有线性相关关系); = 0.05r = 0.9110查 r 界值表,v =14 , , ,r r0.01/2,14 ,所以 P 0.01,按 水准拒绝H0,接受H1,可认为体重指数和收缩压之间存在正相关关系。,计算总体相关系数的可信区间时,由于r 呈非正态分布,所以需要先对r 作 Z 转换:,第四节 相关系数的可信区间,计算总体相关系数的可信区间: 对 r 作 Z 变换:按正态近似原理计算 Z 的(1-)可
11、信区间:对Z 的上下限作反变换,还原得到 r 的(1-)可信区间:,例13-4 例13-2得 r =0.9110,求总体相关系数 的 95% 可信区间。 解: 1先将r 值转换为Z值:,例13-4 例13-2得r =0.9110,求总体相关系数 的 95% 可信区间。 解: 1先将r 值转换为Z值:2查 u界值表得u0.05/2=1.96,代入公式计算Z的95%可信区间:,例13-4 例13-2得r =0.9110,求总体相关系数 的 95%可信区 间。 解: 1先将r 值转换为Z值:2查 u界值表得u0.05/2=1.96,代入公式计算Z的95%可信区间:3代入公式13-5,还原得 的95%
12、可信区间:,例13-4 例13-2得r =0.9110,求总体相关系数 的 95%可信区 间。 解: 1先将r 值转换为Z值:2查 u界值表得u0.05/2=1.96,代入公式计算Z的95%可信区间:3代入公式13-5,还原得 的95%可信区间:即由该样本估计中年女性体重指数和收缩压的总体相关系数 不低于0.76, 最高不超过0.97。,(1)绘制散点图;若点的分布有直线趋势,则 (2)计算样本相关系数 r 值; (3)检验总体相关系数 =0?若 0,则 (4)利用分析结果。(如:描述 X,Y 之间的线性关系以及对总体相关系数进行估计等。),线性相关分析的一般步骤:,(1)绘制散点图;若点的分
13、布有直线趋势,则 (2)计算样本相关系数 r 值; (3)检验总体相关系数 =0?若 0,则 (4)利用分析结果。(如:描述 X,Y 之间的线性关系以及对总体相关系数进行估计等。),线性相关分析的一般步骤:,(1)绘制散点图;若点的分布有直线趋势,则 (2)计算样本相关系数 r 值; (3)检验总体相关系数 =0?若 0,则 (4)利用分析结果。(如:描述 X,Y 之间的线性关系以及对总体相关系数进行估计等。),线性相关分析的一般步骤:,(1)绘制散点图;若点的分布有直线趋势,则 (2)计算样本相关系数 r 值; (3)检验总体相关系数 =0;若 0,则 (4)利用分析结果。(如:描述 X,Y 之间的线性关系以及对总体相关系数进行估计等。),线性相关分析的一般步骤:,?,(1)绘制散点图;若点的分布有直线趋势,则 (2)计算样本相关系数 r 值; (3)检验总体相关系数 =0;若 0,则 (4)利用分析结果。(如:描述 X,Y 之间的线性关系以及对总体相关系数进行估计等。),线性相关分析的一般步骤:,?,(1)绘制散点图;若点的分布有直线趋势,则 (2)计算样本相关系数 r 值; (3)检验总体相关系数 =0;若 0,则 (4)利用分析结果。(如:描述 X,Y 之间的线性关系以及对总体相关系数进行估计等。),