直线相关与回归Linearcorrelationandregression

上传人:公**** 文档编号:567376775 上传时间:2024-07-20 格式:PPT 页数:51 大小:237KB
返回 下载 相关 举报
直线相关与回归Linearcorrelationandregression_第1页
第1页 / 共51页
直线相关与回归Linearcorrelationandregression_第2页
第2页 / 共51页
直线相关与回归Linearcorrelationandregression_第3页
第3页 / 共51页
直线相关与回归Linearcorrelationandregression_第4页
第4页 / 共51页
直线相关与回归Linearcorrelationandregression_第5页
第5页 / 共51页
点击查看更多>>
资源描述

《直线相关与回归Linearcorrelationandregression》由会员分享,可在线阅读,更多相关《直线相关与回归Linearcorrelationandregression(51页珍藏版)》请在金锄头文库上搜索。

1、直线相关与回归直线相关与回归 Linear correlation and regression惟窍坠赋生范萝仅霸掺绑屠艺来拜知桑哪翅讽假谍撼恃伤痕肥棒礁扇摇洱直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression直线相关与回归直线相关与回归 前面介绍的统计方法都只涉及前面介绍的统计方法都只涉及单一变量单一变量,即或进,即或进行行两组或多组比较两组或多组比较,所比较的仍然是,所比较的仍然是同一变量同一变量,而且是以讨论各组间该变量的而且是以讨论各组间该变量的相差是否显著相差是否显著为中为中心环节。心环

2、节。医学领域里常可在一个统一体中遇到医学领域里常可在一个统一体中遇到两个或多个变两个或多个变量之间存在着相互联系、相互制约的情况量之间存在着相互联系、相互制约的情况 .如如:同一批水样的同一批水样的浊度浊度与与透光率透光率,同一批人的,同一批人的年龄年龄与与血压血压以及以及身长、体重与胸围身长、体重与胸围等。等。缓仲析册悯炙雏寄锰失哈绎帕撞西乌赊少试泄责乱莎拼厂咨降窘凯踩则灾直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression如何研究变量之间的关系?如何研究变量之间的关系?在在统统计计方方法法中中通

3、通常常是是用用相相关关与与回回归归的的方方法法来来研研究究不不同变量之间同变量之间的这种的这种相互依存相互依存和和互为消长互为消长的关系。的关系。相相关关与与回回归归即即有有区区别别又又有有联联系系,表表达达事事物物或或现现象象间间的的在在数数量量方方面面相相互互关关系系的的密密切切程程度度用用相相关关系系数数;说说明明一一变变量量依依另另一一变变量量的的消消长长而而变变动动的的规规律律用用回回归方程。归方程。肩撰交疽炔汉雨怕节络挪问洁恭绥聚诗瓶鱼驳绪把刷覆湿纤俩耀籽限苯因直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelation

4、andregression数量关系的特点?数量关系的特点?函数关系:函数关系: 确定。例如园周长与半径:确定。例如园周长与半径:y=2r 。一一对应关系。一一对应关系。回归关系:不确定。例如血压和年龄的关系。回归关系:不确定。例如血压和年龄的关系。 具具有有相相同同年年龄龄的的人人,血血压压不不一一定定相相同同。但但在在一一定定年年龄龄范范围围内内的的人人,其其血血压压会会在在一一定定范范围围内内波波动动。年年龄与血压之间有一定的趋势。龄与血压之间有一定的趋势。熊辱沟蜜品折斗尉娄雷嘱吨菏嚼掌沸帛甩浪质劝哟刀甄咸伏踊喻陇碾迎税直线相关与回归Linearcorrelationandregressi

5、on直线相关与回归Linearcorrelationandregression直线相关直线相关 linear correlation屑窍汾悸甚羊鸡杆斯吓周蕉苫睦息脉房爸但辆撒恨问誓札顷焕急置阴除欺直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression相关相关 - 变量间的互依关系变量间的互依关系直线相关直线相关(linear correlation)也叫简单相关也叫简单相关(simple correlation),用于双变量正态分布资,用于双变量正态分布资料。料。为判断两事物数量间有无相关,可先将两组

6、变量为判断两事物数量间有无相关,可先将两组变量中一对对数值在普通方格纸上作散点图中一对对数值在普通方格纸上作散点图勃纶嘱侧鱼倔睦窘瓢穷纬烩涸耕嘱赢怯欲谋常鳃害议界榜晾溶抿虚厩拴听直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression各种相关关系示意图各种相关关系示意图1.Positive correlation, 2. Perfect positive correlation, 3.Negative correlation,4.Perfect negative correlation, 5.6. 7.

7、 Zero correlation, 8. Non-linear correlation采脾赔浴袋蛛包粒米铺反入宏悄瞻莆缅典束俯瞥吟极韵任冀嵌竹虚伍从铲直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression一、直线相关系数一、直线相关系数 r相关分析是用相关系数(相关分析是用相关系数(r)来表示两个变量间相)来表示两个变量间相互的直线关系,并判断其密切程度的统计方法。互的直线关系,并判断其密切程度的统计方法。又称积差相关系数(又称积差相关系数(coefficient of productmoment

8、correlation),或),或 Pearson 相关系数相关系数(软件中常用此名称)说明相关的密切程度和方(软件中常用此名称)说明相关的密切程度和方向的指标。向的指标。 r -样本相关系数样本相关系数 -总体相关系数总体相关系数相关系数相关系数 linear correlation coefficient盗惺笺往势杜牧放详斥战荷焕敢门溅增考浆优渐嚣昌膝者僧味娠衬洱贸鹿直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression相关系数的意义相关系数的意义相关系数:说明具有直线关系的两变量间,相关系数:说

9、明具有直线关系的两变量间,相关方相关方向与密切程度向与密切程度的统计指标。的统计指标。相关系数相关系数 r 没有单位,在没有单位,在-1+1范围变动,范围变动, 符号符号表示相关的方向,大小表示相关的程度。表示相关的方向,大小表示相关的程度。r 0,正相关;,正相关;rr0。椭圆范围内各点的排列愈接近其长轴,相关愈密椭圆范围内各点的排列愈接近其长轴,相关愈密切,当所有点都在长轴上时,切,当所有点都在长轴上时,r=1(见图(见图2),称),称为完全正相关。为完全正相关。负相关负相关见图见图3,各点分布亦呈椭圆形,各点分布亦呈椭圆形,Y随随X的的增加而减少,增加而减少,X也随也随Y的增加而减少的增

10、加而减少,此时,此时0r-1。各点排列愈接近其长轴,相关愈密切,当所。各点排列愈接近其长轴,相关愈密切,当所有点都在长轴上时,有点都在长轴上时,r=1(见图(见图4),称为完全负),称为完全负相关。相关。 生物现象中,完全正相关或完全负相关甚为少见。生物现象中,完全正相关或完全负相关甚为少见。 写稽虑夏持疙斩邢柑肢迷披薄剁朽揭构惯寐毁播亥玲宰振返蒂暮司帐亥破直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression无相关无相关见图见图5、6和和7,X不论增加或减少,不论增加或减少,Y的的大小不受其影响;反

11、之亦然。此时大小不受其影响;反之亦然。此时r=0。另外,。另外,须注意有时须注意有时虽然各点密集于一条直线,但该直线虽然各点密集于一条直线,但该直线与与X轴或轴或Y轴平行,即轴平行,即X与与Y的消长互不影响的消长互不影响,这,这种情况仍为无相关。种情况仍为无相关。非线性相关非线性相关见图见图8,图中各点的排列不呈直线,图中各点的排列不呈直线趋势,呈某种曲线形状,此时趋势,呈某种曲线形状,此时r0,称为,称为非线性非线性相关相关。 |r|=0.7, 高度相关;高度相关; 0.4=|r|0.7,中度相关;中度相关; |r|0.05P0.05,就,就接受假设,认为此接受假设,认为此r r很可能是从此

12、总体中取得的。很可能是从此总体中取得的。因此判断两变量间无显著关系;因此判断两变量间无显著关系;如果取得如果取得r r值的概率值的概率P0.05P0.05或或P0.01P0.01,就在,就在=0.05=0.05或或=0.01=0.01水准上拒绝检验假设,认为该水准上拒绝检验假设,认为该r r不是来自不是来自=0=0的总体,而来自的总体,而来自00的另一个总的另一个总体,因此判断两变量间有显著关系。体,因此判断两变量间有显著关系。对对r值检验的判断值检验的判断觅朽沪谊揩姑酮幂氏乳吓邵赴作政型寇未涵由难鸟绸雅牟萝贴华殖卢馋哑直线相关与回归Linearcorrelationandregression

13、直线相关与回归Linearcorrelationandregression1 1建立检验假设,建立检验假设,H H0 0:=0=0,H H1 1:00, =0.05 =0.052 2计算相关系数的计算相关系数的r r的的t t值:值:嚏斟面耽腋卞九角杉河顿妄阁变翁埂缎脆订涕龄倚爽炳勿箔载全苞内倘浩直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression3 3查查t t值表作结论值表作结论=n-2=15-2=13=n-2=15-2=13根据专业知识知道凝血酶浓度与凝血时间之间根据专业知识知道凝血酶浓度与凝

14、血时间之间不会呈正相关,故宜用单侧界限,查不会呈正相关,故宜用单侧界限,查t t值表得值表得t t0.01,130.01,13=2.650=2.650今今ttr rtt0.01,130.01,13,P0.01P |r| |r| -P P -相关不显著;相关不显著; r, |r|r|- PP-在在水准上相关显著;水准上相关显著;槽兼问撼肉体锦绰排肥龟乡蛰滨年啦摊根估锣脚畸当沥掏乏哮燃颜鞋缆祟直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression今:今: r=-0.9070 r=-0.9070 , =15

15、-2=13 =15-2=13,查附表界值,得:,查附表界值,得:r r0.05,130.05,13=0.441 r=0.441 r0.01,130.01,13=0.592=0.592 现现rrrr0.01,130.01,13,P0.01,P0,Y随随X的的增大增大而而增大(减少增大(减少而而减少)减少) 斜上斜上; b0,Y随随X的的增大增大而而减小(减少减小(减少而而增加)增加) 斜下斜下; b=0,Y与与X无直线关系无直线关系 水平水平。 b越大,表示越大,表示Y随随X变化越快,直线越陡峭。变化越快,直线越陡峭。柳塔避甲形桅酷鲁僧离拎锐梆辱涸杠杰葛无交省猪乒瞎赃蝴崎烽碱撞罢胶直线相关与回归

16、Linearcorrelationandregression直线相关与回归Linearcorrelationandregression直线回归方程的直线回归方程的计算计算 最小二乘法原则最小二乘法原则(least squares method)(least squares method):使各散点到:使各散点到直线的纵向距离的平方和最小。即:直线的纵向距离的平方和最小。即: 最小。最小。因为直线一定经过因为直线一定经过“均数均数”点点涵替泌咙挟瞪天绘甭邑还仓辽砒虱韩殊派钮辖够度设残殴颠替住伯互残歼直线相关与回归Linearcorrelationandregression直线相关与回归Linea

17、rcorrelationandregression根据前面的相关分析以及医学上有关凝血的机理,根据前面的相关分析以及医学上有关凝血的机理,可知凝血时间依凝血酶浓度而异,且有密切的关可知凝血时间依凝血酶浓度而异,且有密切的关系。因此可进一步作由凝血酶浓度(系。因此可进一步作由凝血酶浓度(X X)推算凝)推算凝血时间(血时间(Y Y)的回归方程。步骤如下:)的回归方程。步骤如下:1 1列回归计算表,计算列回归计算表,计算XX、YY、XX2 2、YY2 2、XYXY。2 2计算计算 、 、(X-X)(X-X)2 2、(X(XX)(Y-Y)X)(Y-Y) =X/n=15.1/15=1.01 =X/n=

18、15.1/15=1.01 =Y/n=222/15=14.80 =Y/n=222/15=14.80(X- )(X- )2 2=X=X2 2-(X)-(X)2 2/n=0.2093/n=0.2093(X- )(Y- )=XY-XY/n=-1.7800(X- )(Y- )=XY-XY/n=-1.7800举例举例维伴忘它矮倦促处百厘韩绦粉滞辜胺寄氦匈锗世乓车绸耘眠避螺姥片按蹄直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression3 3计算回归系数计算回归系数b b和截距和截距a a。本例本例b=-1.7800

19、/0.2093=-8.5045b=-1.7800/0.2093=-8.5045a=14.80-(-8.5045)(1.01)=23.3895a=14.80-(-8.5045)(1.01)=23.38954 4列出回归方程,绘制回归直线列出回归方程,绘制回归直线 喘缅涧蛊舒谗撇例努篷辛粪在燃表仕蕊利塘酿胆敖圃扯簇囚黍蚤疹彦龙攫直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression在凝血酶浓度的实测范围内在凝血酶浓度的实测范围内,即,即X=0.8X=0.8到到X=1.2X=1.2之间,之间,任选两个任选两

20、个X X值(值(一般选相距较远且直角坐标系上一般选相距较远且直角坐标系上容易读出者容易读出者),代入此回归方程,即得相应的两),代入此回归方程,即得相应的两个个Y Y值,就可画出该直线。值,就可画出该直线。须注意回归直线必通过(须注意回归直线必通过( )点,并穿过观察)点,并穿过观察点群,直线上下各有一些点散布着,否则计算有点群,直线上下各有一些点散布着,否则计算有误。误。绎破纬宠毋普旦轨柞势划猜醋葵王苗郴恬辫够窜刑斧手轰壳粕斟蔚怀蝎榜直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression直线回归方程

21、的统计推断直线回归方程的统计推断l总体回归系数的估计:例题总体回归系数的估计:例题216页页样本回归系数的标准误样本回归系数的标准误剩余标准差剩余标准差参差平方和参差平方和英巍厚服窃峻崔蔗荆科渍励逃酒五瑰治袍唉灌帛朝魁郧岗衰带私阮诲秒桂直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression为何进行总体回归系数的估计?为何进行总体回归系数的估计?l1. 由于抽样误差的存在,每次抽样所得到的样本由于抽样误差的存在,每次抽样所得到的样本回归系数有所不同。那么,用它来估计总体回归回归系数有所不同。那么,用它来

22、估计总体回归系数也会不同。为了说明回归方程的稳定性,要系数也会不同。为了说明回归方程的稳定性,要对总体的回归系数进行估计。对总体的回归系数进行估计。l2. 可信度相同时,回归系数的标准误越小,可信可信度相同时,回归系数的标准误越小,可信区间就越小,回归方程就稳定。区间就越小,回归方程就稳定。架臂唇私箱斤霉沛甥樊辈趣卸安窝泛苑宴占祸张号丘辛涸囱仟协啊恤幌殴直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression(一)样本回归系数的假设检验(一)样本回归系数的假设检验 b0 b0原因:原因: 由于抽样误差引

23、起,总体回归系数由于抽样误差引起,总体回归系数=0=0 存在回归关系,总体回归系数存在回归关系,总体回归系数 0 0直线回归方程的假设检验直线回归方程的假设检验样本回归系数的假设检验亦样本回归系数的假设检验亦用用t t检验检验。 H H0 0:=0=0即即Y Y的变化与的变化与X X无关;无关;H H1 1:00即即Y Y的变化与的变化与X X有关;有关;诡埋磕蔚棠贿节叠皂耍魔忿烬搭楼隆鳃蛊伸肤直瞬痘刊臣湖俐警深呐圾袜直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression分母分母S Sb b是样本回归

24、系数是样本回归系数b b的标准误,计算公式为:的标准误,计算公式为:Sy.x为各观察值为各观察值Y距回归线的标准差(剩余标准差)距回归线的标准差(剩余标准差),即当,即当X的影响被扣去以后的影响被扣去以后Y方面的变异,方面的变异, 雍蹦挎粳软部傀忙曲捅挝勤迁皖混龋立惑梗瘟寨举眨屋妓欣分尤松辖仔杨直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression根据数理统计的理论,同一批资料计算所得根据数理统计的理论,同一批资料计算所得tr与与tb是相同的,即是相同的,即tr=tb。处理资料时可用检验相关显。处理资

25、料时可用检验相关显著性代替其回归显著性。著性代替其回归显著性。 由于由于 r在在=0.01水准上显著,故可判断样本回归系水准上显著,故可判断样本回归系数数-8.5045与与0的相差有显著性,说明存在凝血时的相差有显著性,说明存在凝血时间随凝血酶浓度变化而变化的回归关系。间随凝血酶浓度变化而变化的回归关系。 坞朗豌挠友撼躇慈和贴孝贬主铱俭代耸业肾帽惟俘气仲湍由瓜叉湾妙也耿直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression(二)两样本回归系数相差的假设检验(二)两样本回归系数相差的假设检验若有两个可以

26、比较的样本,它们的回归系数分别为若有两个可以比较的样本,它们的回归系数分别为b1与与b2,经检验都为显著,回归系数的标准误分别为,经检验都为显著,回归系数的标准误分别为Sb1和和Sb2。b1与与b2相差的显著性也可用相差的显著性也可用t检验法检验,检验法检验,其计算公式为:其计算公式为: 弗用腾颜菲观待苏吉妙坠羊打胳雇酒颊眶登浙筛峨蓟尖偷罪薄养福桂溃笺直线相关与回归Linearcorrelationandregression直线相关与回归LinearcorrelationandregressionS2C为两样本回归系数的合并方差为两样本回归系数的合并方差 别荚庆留蛾告搐硼菩并绿窘屯湿订毁账臀骤

27、殆溪坦些斜闷祸纸棺谩勋悼台直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression实例:两样本回归系数实例:两样本回归系数t检验的步骤。检验的步骤。 同一批白蛋白于同一批白蛋白于38与与25条件下,不同时间条件下,不同时间(分)的凝固百分比,问由此而得的两样本回归(分)的凝固百分比,问由此而得的两样本回归系数相差是否显著?系数相差是否显著? 白蛋白在两种温度下各不同时间的凝固百分比白蛋白在两种温度下各不同时间的凝固百分比烤能出下仔蜂薛丹指区搬筒楷瞒吝甲冶欠揽娘茄骡剂葬仁淤蔷颁强胡榴站直线相关与回归Lin

28、earcorrelationandregression直线相关与回归Linearcorrelationandregression1H0:1-2=0 H1:1-20=0.012计算计算t值值 臆滁鲁蔚寐簧线拜伸拨漱矣缆袜励斩丛仓股釉孕减挡倾蚊田夹豺卧篇篓姓直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregressionlr1=0.998(P0.01) b1=3.389 l(Y1- 1)2=5.7927 n1=6lr2=0.996(Pttt0.01,80.01,8, ,故故P0.01Pb1,说明随着时间,说明随着时

29、间的增加,蛋白质在的增加,蛋白质在38时凝固百分比的增加量比时凝固百分比的增加量比在在25时高。时高。疯哼掣堵荤庇晨底滋设紫府赁空置妈盆急晶婴屎生敦箭苑隆糙边怒故眼砾直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression直线回归方程的应用直线回归方程的应用l1. 描述两变量间的依存变化的数量关系。描述两变量间的依存变化的数量关系。l2.利用回归方程进行预测预报。利用回归方程进行预测预报。l3.用易得指标估计不易得指标。用易得指标估计不易得指标。l4. 利用回归方程进行统计控制(逆估计)。利用回归方程进

30、行统计控制(逆估计)。摩愿领侠思篙斩龙类缘类隧菱往缕仁隐矣哉酝舞呀影戈岂纶墙疡精绣柴一直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression1作回归分析要有实际意义:作回归分析要有实际意义: 不要把毫无关联的两个事物或现象用来作回归分不要把毫无关联的两个事物或现象用来作回归分析。析。 如儿童身高的增长与小树的增长,作相关分析是如儿童身高的增长与小树的增长,作相关分析是没有实际意义的;由儿童身高推算小树高的回归没有实际意义的;由儿童身高推算小树高的回归方程则更无实际意义,即使算得的方程则更无实际意义,即

31、使算得的r、b是显著的。是显著的。 直线回归分析的注意事项直线回归分析的注意事项 岗逸卖熔顽轿工遥搁箭襄籽厄施舱挎钱勉霉搞懈茵紫迷露瓦霹奈煽觅挂疟直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression2对相关分析的作用要正确理解。对相关分析的作用要正确理解。 相关分析只是以相关分析只是以相关系数相关系数来描述两个变量间相互来描述两个变量间相互关系的密切程度和方向,并不能阐明两事物或现关系的密切程度和方向,并不能阐明两事物或现象间存在联系的本质。而且相关并不一定就是因象间存在联系的本质。而且相关并不一定

32、就是因果关系,切不可单纯依靠相关系数或回归系数的果关系,切不可单纯依靠相关系数或回归系数的显著性显著性“证明证明”因果关系之存在。要证明两事物因果关系之存在。要证明两事物间的因果关系,必须凭籍专业知识从理论上加以间的因果关系,必须凭籍专业知识从理论上加以阐明。阐明。矩萤瓢披瀑队噎妻揩绅绣忿取嘲馅眉题门善谆岁殆吸任晤脯遭杰婪略衬氟直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression3相关与回归的区别和联系:相关与回归的区别和联系: (1)相关表示两变量间的相互关系,是双方向相关表示两变量间的相互关系,

33、是双方向的。而回归则表示的。而回归则表示Y随随X而变化,这种关系是单而变化,这种关系是单方向的。方向的。一般地,一般地,先求出相关系数先求出相关系数r并对其进行假设检验,并对其进行假设检验,如果如果r显著并有进行回归分析之必要,再建立回显著并有进行回归分析之必要,再建立回归方程。归方程。 (2)回归系数与相关系数的正负号都由两变量离)回归系数与相关系数的正负号都由两变量离均差积之和的符号决定,所以均差积之和的符号决定,所以同一资料的同一资料的b与其与其r的符号相同的符号相同。假设检验等价假设检验等价: tr=tb大寻杀褒蠢顶雀虞控历柯俊今酌运附劝絮邓沿蟹爸沤隘撅段值畦蔑须粉策直线相关与回归Li

34、nearcorrelationandregression直线相关与回归Linearcorrelationandregression(3)回归系数有单位,形式为应变量单位)回归系数有单位,形式为应变量单位/自变量自变量单位;相关系数没有单位。单位;相关系数没有单位。(4)相关系数的范围在)相关系数的范围在-1+1之间,回归系数无之间,回归系数无限制。限制。 (5)用回归解释相关:决定系数)用回归解释相关:决定系数(coefficient of determination)瘩了例镊晤诞筋楼杨暴诲脚圈澜丧辣仿拎艺兔椒童城擂鹃章躯酒纽衙瞥汇直线相关与回归Linearcorrelationandregr

35、ession直线相关与回归Linearcorrelationandregression4适合作相关和回归分析的资料有两种:适合作相关和回归分析的资料有两种:(1)变量)变量X是选定的,变量是选定的,变量Y是从正态分布的总体是从正态分布的总体中随机抽取的,宜作回归分析。中随机抽取的,宜作回归分析。(2)两变量)两变量X、Y(或(或X1、X2)都是从正态分布)都是从正态分布的总体中随机抽取的,即是正态双变量中的随机的总体中随机抽取的,即是正态双变量中的随机样本。若需要由一个变量推算另一个变量可作回样本。若需要由一个变量推算另一个变量可作回归分析;若只需说明两变量间的相互关系可作相归分析;若只需说明

36、两变量间的相互关系可作相关分析。关分析。如果变量(一个或两个)呈明显偏态时,如果变量(一个或两个)呈明显偏态时,须经过适当的变量代换(如对数代换等),使资须经过适当的变量代换(如对数代换等),使资料接近正态分布后再做相关与回归分析;或采用料接近正态分布后再做相关与回归分析;或采用秩相关法秩相关法 ;利筑侩坊尺违妆疾设镇偿谴驻淀棠协郑瞳寥鹤青瑚缚览娃天喝让胯傲擅其直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression5 5在回归分析中,在回归分析中,由由X X推算推算Y Y与由与由Y Y推算推算X X的

37、回归方程是不的回归方程是不同的,不可混淆同的,不可混淆。 必须正确选定自变量与应变量。一般说,事物的原因作必须正确选定自变量与应变量。一般说,事物的原因作自变量自变量X X,当事物的因果关系不很明确时,选误差较小,当事物的因果关系不很明确时,选误差较小的即的即个体变异小的变量作自变量个体变异小的变量作自变量X X,以推算应变量,以推算应变量Y Y。6 6回归方程的适用范围有其限度,一般仅适用于自变量回归方程的适用范围有其限度,一般仅适用于自变量X X的原数据范围内,而的原数据范围内,而不能任意外推不能任意外推。 在这些观察值的范围之外,两变量间是否也呈同样的直在这些观察值的范围之外,两变量间是否也呈同样的直线关系?线关系?量柳木救兆冲翻拐挨庞螺束拉之轻谈蛾兢酶猴嘱淖粟丁贸孔鹅赎市哪镜逊直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression谢谢!谢谢!疏哮觉彬问罗衙怨铭口铡以盯俄筒栗诱森亢赁奄旬巡啊氛公赂睫臃侠偷醋直线相关与回归Linearcorrelationandregression直线相关与回归Linearcorrelationandregression

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号