第六讲相关分析与回归分析法.

上传人:今*** 文档编号:107655611 上传时间:2019-10-20 格式:PPT 页数:131 大小:4.01MB
返回 下载 相关 举报
第六讲相关分析与回归分析法._第1页
第1页 / 共131页
第六讲相关分析与回归分析法._第2页
第2页 / 共131页
第六讲相关分析与回归分析法._第3页
第3页 / 共131页
第六讲相关分析与回归分析法._第4页
第4页 / 共131页
第六讲相关分析与回归分析法._第5页
第5页 / 共131页
点击查看更多>>
资源描述

《第六讲相关分析与回归分析法.》由会员分享,可在线阅读,更多相关《第六讲相关分析与回归分析法.(131页珍藏版)》请在金锄头文库上搜索。

1、相关分析 回归分析,第六讲 定量分析方法(二),1,中南大学医药信息系 文庭孝,Tel:18570341900 E-mail:wtxsomebody,开放式精品示范课堂,2,相关关系,一、问题的提出 二、相关关系的概念 三、相关关系的种类 四、相关关系的主要内容,3,一、问题的提出,相关,唯物辩证法 世界是普遍联系的 没有孤立存在的事物和现象 小世界理论 相似性原理,4,伊拉克战争,correlation?,SARS,?,5,蝴蝶翅膀振动,候鸟迁徙,海啸,死亡人数,correlation?,6,二、相关关系的概念,客观现象之间的数量关系存在两种类型: 函数关系 相关关系,函数关系:即当一个(或

2、一组)变量每取一个值时,相应的另一个变量必然有一个确定值与之相对应 。 相关关系:变量之间存在依存关系,但这是不完全确定的随机关系,即当一个(或一组)变量每取一个值时,相应的另一个变量可能有多个不同值与之对应 。,二、相关关系的概念,8,函数关系,(1)是一一对应的确定关系 (2)设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 (3)各观测点落在一条线上,9,自变量与因变量,如果变量之间有因果关系,那么原因变量就叫作自

3、变量,而受自变量影响的变量(结果变量)称因变量。自变量通常发生在因变量之前。 不是所有先发生的变量都是自变量。 一般自变量记为X,因变量记为Y。, ,10,【例】函数关系,(1) 某种商品的销售额(y)与销售量(x)之间的关系可表示为 y = p*x (p 为单价) (2)圆的面积(S)与半径之间的关系可表示为 S = *R2 (3)企业的原材料消耗额(y)与产量(x1) 、单位产量消耗(x2) 、原材料价格(x3)之间的关系可表示为y = x1*x2*x3,11,停下来 想一想?,自变量与因变量判断 1. 产品产量与总成本。 2. 销售税的总量与商品总成本。 3. 电影院里爆米花的销售量与垃

4、圾袋的使用量。 4. 太阳能发电量与热天的天数。,12,相关关系,1.变量间关系不能用函数关系精确表达 2.一个变量的取值不能由另一个变量唯一确定 3.当变量 x 取某个值时,变量 y 的取值可能有几个 4.各观测点分布在直线周围,13,【例】相关关系,商品的消费量(y)与居民收入(x)之间的关系 商品销售额(y)与广告费支出(x)之间的关系 粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系 收入水平(y)与受教育程度(x)之间的关系 父母亲身高(y)与子女身高(x)之间的关系 身高与体重的关系,14,停下来 想一想?,下列变量之间存在相关关系吗? 1.抽烟与肺癌之

5、间的关系 2.怀孕期妇女的饮酒量与婴儿出生体重之间的关系 3.纳税者年龄和他们交纳税款的数量之间的关系 4.采光量与植物的生产量之间的关系 5.一个人的投票倾向性与其年龄之间的关系,15,在一定的条件下互相转化 具有函数关系的变量,当存在观测误差和随机因素影响时, 往往以相关的形式表现出来; 具有相关关系的变量之间的联系,如果对它们有了深刻的规律性认识,并且能够把影响因变量变动的因素全部纳入方程,这时相关关系可转化为函数关系; 相关关系也具有某种变动规律,所以,相关关系也经常可以用一定的函数形式近似地描述。,函数关系与相关关系的关系,16,因果关系,相关关系,互为因果关系,共变关系,随机性依存

6、关系,确定性依存关系,函数关系,变量之 间关系,变量之间关系的总结,17,三、相关关系的种类,1.按相关的程度分:,完全相关:在价格P不变的情况下,销售收入Y与销售量X的关系。 不相关:股票价格的高低与气温的高低不相关。,18,2.按相关的方向分:,正相关:两个变量之间的变化方向一致,都是增长趋势或下降趋势。 收入与消费的关系:工人的工资随劳动生产率的提高而提高。,负相关:两个变量变化趋势相反,一个下降而另一个上升,或一个上升而另一个下降。 物价与消费的关系:商品流转的规模愈大,流通费用水平则越低。,三、相关关系的种类,19,3.按相关的形式分:,线性相关(直线相关):当一个变量每变动一个单位

7、时,另一个变量按一个大致固定的增(减)量变动。 例:人均消费水平与人均收入水平。,非线性相关(曲线相关):当一个变量变动时, 另一个变量也相应发生变动,但这种变动是不均等的。 例: 产品的平均成本与总产量; 农产量与施肥量。,三、相关关系的种类,20,4 .按相关的影响因素多少分:,单相关,复相关,偏相关,单相关(一元相关):只有一个自变量。 如: 居民的收入与储蓄额; 成本与产量。,复相关(多元相关):有两个及两个以上的自变量。 如: 某种商品的需求与其价格水平以及收入水平之间的相关关系。,三、相关关系的种类,偏相关:在某一现象与多种现象相关的场合,假定其他变量不变,专门考察其中两个变量的相

8、关关系称为偏相关。 如: 在假定人们的收入水平不变的条件下,某种商品的需求与其价格水平的关系就是一种偏相关。,21,5.按相关的性质分:,真实相关:由现象的内在联系所决定。,虚假相关:如某人曾观察过某一国家历年的国内生产总值与精神病患者人数的关系,呈相当高的正相关。(偶然或巧合),三、相关关系的种类,22,讨论下面的关系是因果关系还是伪关系? 1. 冰淇淋的销量与儿童出事故次数之间 2. 街上警察数量与犯罪数量之间 3. 历史上,妇女裙子的长度与经济的好坏有关系: 裙子越短,经济越景气。 4. 鹳的数量与丹麦乡间婴儿出生率的关系,三、相关关系的种类,23,三、相关关系的种类,24,定性分析,依

9、据研究者的知识和经验来对客观现象之间是否存在相关关系以及存在何种关系作出判断。,定量分析,通过编制相关表、绘制相关图、计算相关系数等方法来判断现象之间是否存在相关关系及相关方向、形态和密切程度。,相关关系的判断,25,四、相关分析的主要内容,根据研究目的搜集有关资料 编制相关图表 计算相关系数 建立回归方程 进行统计检验,26,相关分析: 就是用一个指标来表明现象间相互依存关系的密切程度。 广义的相关分析包括相关关系分析(狭义的相关分析)和回归分析。,相关分析的概念,27,相关图表,相关图表 相关表和相关图是研究相关关系的直观工具,在进行详细的定量分析之前, 可以先利用它们对现象之间存在的相关

10、关系的方向、形式和密切程度作大致判断。,简单相关表:将自变量x的数值按照从小到大的顺序,并配合因变量y的数值一一对应而平行排列的表。,居民消费和收入的相关表,单位:百元,简单相关表,29,相关图:又称散点图,将x置于横轴上,y置于纵轴上,将(x,y)绘于坐标图上,用来反映两个变量之间相关关系的图形。,简单相关图,30,简单相关系数,相关系数 度量两个变量之间线性相关密切程度和相关方向的统计指标。 包括简单相关系数、复相关系数、偏相关系数、曲线相关系数(相关指数)。 简单相关系数又称皮尔逊(1890年,英国)相关系数,或积矩相关系数或动差相关系数。,相关系数若是根据总体数据计算的,称为总体相关系

11、数,记为(方差占总差的比例) 相关系数若是根据样本数据计算的,则称为样本相关系数,记为 r。样本相关系数是总体相关系数的一致估计量。,简单相关系数,32, 样本简单相关系数的计算公式(积差法),简单相关系数的计算公式,式中:,(1),用计算器计算相关系数,33,(1)式可化简为:,或:,(2),34,1. r 的取值范围是 -1,1 |r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负相关 2. r = 0,不存在线性相关关系 3. -1r0,为负相关 4. 0r1,为正相关 5. |r|越趋于1表示关系越密切;|r|越趋于0表示 关系越不密切,相关系数取值及其意义,35,r的

12、范围在0.1-0.3是微弱相关; r的范围在0.3-0.5是低度相关; r的范围在0.5-0.8是显著相关; r的范围在0.8以上是高度相关。,相关系数取值及其意义,36,r,相关系数取值及其意义,37,【例1】在研究我国人均消费水平的问题中,把全国人均消费额记为y,把人均国民收入记为x。根据19811993年的样本数据(xi ,yi),i =1,2,,13,计算相关系数。,38,解:根据样本相关系数的计算公式有 人均国民收入与人均消费金额之间的相关系数为 0.9987,高度相关。,计算相关系数的计算实例,39,【例2】计算人均可支配收入和消费支出之间 的简单相关系数。,解:由表中数据得,y

13、473, x 662, y2 26507, x2 51656,xy 36933,n=10,计算得人均可支配收入和消费支出间的简单 相关系数为0.9878,高度相关。,2008-1-4,41,相关系数的显著性检验,检验两个变量之间是否存在线性相关关系 总体相关系数是未知的,常用样本相关系数来估计,不同的样本其相关系数不同,r对 代表程度与样本容量有关。 计算出样本相关系数r以后,还要对其进行显著性检验,以判定现象总体间线性相关是否显著。,显著性检验(significance test)是事先对总体的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设是否合理,即判断总体的真实情况与原假

14、设是否有显著性差异。或者说,显著性检验要判断样本与对总体所做的假设之间的差异是纯属机会变异,还是由假设与总体真实情况之间不一致所引起的。 显著性检验是针对我们对总体所做的假设做检验,其原理就是“小概率事件实际不可能性原理”来接受或否定假设。 抽样实验会产生抽样误差,在进行比较分析时,不能仅凭结果的不同就作出结论,而是要进行统计学分析,鉴别出两者差异是抽样误差引起的,还是由特定的实验处理引起的。 采用 t 检验,相关系数的显著性检验,在二元正态总体情况下,r的抽样分布具有确定的函数形式,当总体相关系数 时,r呈t分布(n=30)。,相关系数的显著性检验,43, 对计算的相关系数进行显著性检(0.

15、05) 1. 提出假设:H0: ;H1: 0,3. 根据显著性水平0.05,查t分布表 得t(n-2)=2.306 由于t=17.94t(10-2)=2.306,拒绝H0,总体人均消费支出与人均可支配收入之间的线性相关关系显著。,2. 计算检验的统计量,44,t检验表,为了简化检验的过程,有人根据t统计量和r的关系,编成相关系数临界值表,相关系数的显著性检验可直接查表进行。 检验方法: 对于给定的显著性水平 若r r (n-2) ,变量x与y之间有显著的线性相关关系。 若 r r (n-2) ,变量x与y之间不存在线性相关关系。,46,相关系数显著性检验的简化方法,相关系数临界值表, 给定的显

16、著性水平,n-2为自由度,48,相关系数检验表的使用,若r 大于表上的=0.05相应的值,小于表上0.1相应的值,称变量x与y之间有显著的线性关系 若r 大于表上=0.1相应的值,称变量x与y之间有十分显著的线性关系 若r 小于表上=0.05相应的值,称变量x与y之间没有明显的线性关系,例1: r =0.9987=0.05 (13-2)=0.553 人均消费金额与人均国民收入之间有十分显著的线性相关关系。 例2: r =0.9878 =0.05 (10-2)=0.632 总体人均消费支出与人均可支配收入之间有十分显著的线性相关关系。,相关系数检验表的使用,49,回归分析,50,回归分析的概念(Regression),用样本数据确定变量的数学关系式; 对关系式的可信程度进行统计检验,找到影响某一特定变量的显著因素; 根据变量的取值来预测或控

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号