统计学相关分析

上传人:壹****1 文档编号:568840583 上传时间:2024-07-27 格式:PPT 页数:92 大小:857.50KB
返回 下载 相关 举报
统计学相关分析_第1页
第1页 / 共92页
统计学相关分析_第2页
第2页 / 共92页
统计学相关分析_第3页
第3页 / 共92页
统计学相关分析_第4页
第4页 / 共92页
统计学相关分析_第5页
第5页 / 共92页
点击查看更多>>
资源描述

《统计学相关分析》由会员分享,可在线阅读,更多相关《统计学相关分析(92页珍藏版)》请在金锄头文库上搜索。

1、第二章第二章 相关分析相关分析n n第一节第一节 相关关系及种类相关关系及种类n n第二节第二节 定类变量的相关分析定类变量的相关分析n n第三节第三节 定序变量的相关分析定序变量的相关分析n n第四节第四节 定距变量的相关分析定距变量的相关分析7/27/20241 社会上,许多现象之间也都有相互联系,例如:社会上,许多现象之间也都有相互联系,例如:社会上,许多现象之间也都有相互联系,例如:社会上,许多现象之间也都有相互联系,例如:身高与体重、教育程度和收入、学业成就和家庭环境、身高与体重、教育程度和收入、学业成就和家庭环境、身高与体重、教育程度和收入、学业成就和家庭环境、身高与体重、教育程度

2、和收入、学业成就和家庭环境、智商与父母智力等。在这些有关系的现象中,它们之智商与父母智力等。在这些有关系的现象中,它们之智商与父母智力等。在这些有关系的现象中,它们之智商与父母智力等。在这些有关系的现象中,它们之间联系的程度和性质也各不相同。间联系的程度和性质也各不相同。间联系的程度和性质也各不相同。间联系的程度和性质也各不相同。 本书第十章提出了两总体的检验及估计的问题,这本书第十章提出了两总体的检验及估计的问题,这本书第十章提出了两总体的检验及估计的问题,这本书第十章提出了两总体的检验及估计的问题,这意味着我们开始与双变量统计方法打交道了。双变量意味着我们开始与双变量统计方法打交道了。双变

3、量意味着我们开始与双变量统计方法打交道了。双变量意味着我们开始与双变量统计方法打交道了。双变量统计与单变量统计最大的不同之处是,客观事物间的统计与单变量统计最大的不同之处是,客观事物间的统计与单变量统计最大的不同之处是,客观事物间的统计与单变量统计最大的不同之处是,客观事物间的关联性开始披露出来。这一章我们将把相关关系的讨关联性开始披露出来。这一章我们将把相关关系的讨关联性开始披露出来。这一章我们将把相关关系的讨关联性开始披露出来。这一章我们将把相关关系的讨论深入下去,不仅要对相关关系的存在给出判断,更论深入下去,不仅要对相关关系的存在给出判断,更论深入下去,不仅要对相关关系的存在给出判断,更

4、论深入下去,不仅要对相关关系的存在给出判断,更要对相关关系的强度给出测量,同时要披露两变量间要对相关关系的强度给出测量,同时要披露两变量间要对相关关系的强度给出测量,同时要披露两变量间要对相关关系的强度给出测量,同时要披露两变量间的因果联系,其内容分为相关分析和回归分析这两个的因果联系,其内容分为相关分析和回归分析这两个的因果联系,其内容分为相关分析和回归分析这两个的因果联系,其内容分为相关分析和回归分析这两个大的方面。大的方面。大的方面。大的方面。7/27/20242第一节第一节 变量之间的相互关系变量之间的相互关系1. 1. 相关程度相关程度相关程度相关程度 完全相关,指变量之间为函数关系

5、;完全不相关指变完全相关,指变量之间为函数关系;完全不相关指变完全相关,指变量之间为函数关系;完全不相关指变完全相关,指变量之间为函数关系;完全不相关指变量之间不存在任何依存关系,彼此独立。不完全相关介于量之间不存在任何依存关系,彼此独立。不完全相关介于量之间不存在任何依存关系,彼此独立。不完全相关介于量之间不存在任何依存关系,彼此独立。不完全相关介于两者之间。不完全相关是本章讨论的重点。两者之间。不完全相关是本章讨论的重点。两者之间。不完全相关是本章讨论的重点。两者之间。不完全相关是本章讨论的重点。 由于数学手段上的局限性,统计学探讨的最多的是定由于数学手段上的局限性,统计学探讨的最多的是定

6、距距定距变量间能近似地表现为一条直线的线性相关。在定距变量间能近似地表现为一条直线的线性相关。在统计中,对于线性相关,采用相关系数(记作统计中,对于线性相关,采用相关系数(记作r r)这一指标)这一指标来量度相关关系程度或强度。就线性相关来说,当来量度相关关系程度或强度。就线性相关来说,当r r l l时,表示为完全相关;当时,表示为完全相关;当r r =0=0时,表现为无相关或零相时,表现为无相关或零相关;当关;当0 0 r r 1 1时,表现为不完全相关。时,表现为不完全相关。7/27/20243 2. 2. 相关方向:正相关和负相关相关方向:正相关和负相关相关方向:正相关和负相关相关方向

7、:正相关和负相关 所谓正相关关系是指一个变量的值增加时,另一变所谓正相关关系是指一个变量的值增加时,另一变所谓正相关关系是指一个变量的值增加时,另一变所谓正相关关系是指一个变量的值增加时,另一变量的值也增加。例如,受教育水平越高找到高薪水工作的量的值也增加。例如,受教育水平越高找到高薪水工作的量的值也增加。例如,受教育水平越高找到高薪水工作的量的值也增加。例如,受教育水平越高找到高薪水工作的机会也越大。而负相关关系是指一个变量的值增加时,另机会也越大。而负相关关系是指一个变量的值增加时,另机会也越大。而负相关关系是指一个变量的值增加时,另机会也越大。而负相关关系是指一个变量的值增加时,另一变量

8、的值却减少。例如,受教育水平越高,理想子女数一变量的值却减少。例如,受教育水平越高,理想子女数一变量的值却减少。例如,受教育水平越高,理想子女数一变量的值却减少。例如,受教育水平越高,理想子女数目越少。要强调的是,只有定序以上测量层次的变量才分目越少。要强调的是,只有定序以上测量层次的变量才分目越少。要强调的是,只有定序以上测量层次的变量才分目越少。要强调的是,只有定序以上测量层次的变量才分析相关方向,因为只有这些变量的值有高低或多少之分。析相关方向,因为只有这些变量的值有高低或多少之分。析相关方向,因为只有这些变量的值有高低或多少之分。析相关方向,因为只有这些变量的值有高低或多少之分。至于定

9、类变量,由于变量的值并无大小、高低之分,故定至于定类变量,由于变量的值并无大小、高低之分,故定至于定类变量,由于变量的值并无大小、高低之分,故定至于定类变量,由于变量的值并无大小、高低之分,故定类变量与其他变量相关时就没有正负方向了。类变量与其他变量相关时就没有正负方向了。类变量与其他变量相关时就没有正负方向了。类变量与其他变量相关时就没有正负方向了。7/27/20244 3. 3. 因果关系与对称关系因果关系与对称关系因果关系与对称关系因果关系与对称关系 因果关系中两个变量有自变量(因果关系中两个变量有自变量(因果关系中两个变量有自变量(因果关系中两个变量有自变量(independent i

10、ndependent Variable)Variable)和因变量和因变量和因变量和因变量(dependent Variable)(dependent Variable)之分:之分:之分:之分: (1 1)两个变量有共变关系;)两个变量有共变关系;)两个变量有共变关系;)两个变量有共变关系; (2 2)因变量的变化是由自变量的变化引起的;)因变量的变化是由自变量的变化引起的;)因变量的变化是由自变量的变化引起的;)因变量的变化是由自变量的变化引起的; (3 3)两个变量的产生和变化有明确的时间顺序,前者)两个变量的产生和变化有明确的时间顺序,前者)两个变量的产生和变化有明确的时间顺序,前者)两

11、个变量的产生和变化有明确的时间顺序,前者称为自变量,后者称为因变量。称为自变量,后者称为因变量。称为自变量,后者称为因变量。称为自变量,后者称为因变量。 表现为对称关系的相关关系,互为根据,不能区分自表现为对称关系的相关关系,互为根据,不能区分自表现为对称关系的相关关系,互为根据,不能区分自表现为对称关系的相关关系,互为根据,不能区分自变量和因变量,或者说自变量和因变量可以根据研究目的变量和因变量,或者说自变量和因变量可以根据研究目的变量和因变量,或者说自变量和因变量可以根据研究目的变量和因变量,或者说自变量和因变量可以根据研究目的任意选定,例如身高和体重之间的关系。任意选定,例如身高和体重之

12、间的关系。任意选定,例如身高和体重之间的关系。任意选定,例如身高和体重之间的关系。 7/27/202454. 4. 单相关和复相关单相关和复相关单相关和复相关单相关和复相关 从变量的多少上看,单相关只涉及两个变量,亦称二元从变量的多少上看,单相关只涉及两个变量,亦称二元从变量的多少上看,单相关只涉及两个变量,亦称二元从变量的多少上看,单相关只涉及两个变量,亦称二元相关;三个或三个以上变量之间的关系称为复相关,亦称多相关;三个或三个以上变量之间的关系称为复相关,亦称多相关;三个或三个以上变量之间的关系称为复相关,亦称多相关;三个或三个以上变量之间的关系称为复相关,亦称多元相关。元相关。元相关。元

13、相关。五、直线相关和曲线相关五、直线相关和曲线相关五、直线相关和曲线相关五、直线相关和曲线相关 从变量变化的形式上看,如果关系近似地表现为一条直从变量变化的形式上看,如果关系近似地表现为一条直从变量变化的形式上看,如果关系近似地表现为一条直从变量变化的形式上看,如果关系近似地表现为一条直线,称为直线相关或线性相关;如果关系近似地表现为一条线,称为直线相关或线性相关;如果关系近似地表现为一条线,称为直线相关或线性相关;如果关系近似地表现为一条线,称为直线相关或线性相关;如果关系近似地表现为一条曲线,则称为曲线相关或称为非线性相关。曲线,则称为曲线相关或称为非线性相关。曲线,则称为曲线相关或称为非

14、线性相关。曲线,则称为曲线相关或称为非线性相关。 由于数学手段的局限性,我们以学习线性相关为主。在由于数学手段的局限性,我们以学习线性相关为主。在由于数学手段的局限性,我们以学习线性相关为主。在由于数学手段的局限性,我们以学习线性相关为主。在统计学中,通过分段处理线性相关也可以用于处理曲线相统计学中,通过分段处理线性相关也可以用于处理曲线相统计学中,通过分段处理线性相关也可以用于处理曲线相统计学中,通过分段处理线性相关也可以用于处理曲线相关。关。关。关。7/27/20246第二节第二节 定类变量的相关分析定类变量的相关分析本节内容:本节内容:1、列联表、列联表2、削减误差比例、削减误差比例3、

15、系数系数4、系数系数7/27/202471. 1. 列联表列联表列联表列联表 列联表,是按品质标志把两个变量的频数分布进列联表,是按品质标志把两个变量的频数分布进列联表,是按品质标志把两个变量的频数分布进列联表,是按品质标志把两个变量的频数分布进行交互分类,由于表内的每一个频数都需同时满足两个行交互分类,由于表内的每一个频数都需同时满足两个行交互分类,由于表内的每一个频数都需同时满足两个行交互分类,由于表内的每一个频数都需同时满足两个变量的要求,所以列联表又称条件频数表。变量的要求,所以列联表又称条件频数表。变量的要求,所以列联表又称条件频数表。变量的要求,所以列联表又称条件频数表。 例如,某

16、区调查了例如,某区调查了例如,某区调查了例如,某区调查了357357名选民,考察受教育程度与投名选民,考察受教育程度与投名选民,考察受教育程度与投名选民,考察受教育程度与投票行为之间的关系,将所得资料作成下表,便是一种关票行为之间的关系,将所得资料作成下表,便是一种关票行为之间的关系,将所得资料作成下表,便是一种关票行为之间的关系,将所得资料作成下表,便是一种关于频数的列联表。于频数的列联表。于频数的列联表。于频数的列联表。7/27/2024822频数分布列联表的一般形式频数分布列联表的一般形式n n习惯上把因变量习惯上把因变量习惯上把因变量习惯上把因变量Y Y放在表侧,把自变量放在表侧,把自

17、变量放在表侧,把自变量放在表侧,把自变量X X放在表头。放在表头。放在表头。放在表头。n n2222列联表是最简单的交互分类表。列联表是最简单的交互分类表。列联表是最简单的交互分类表。列联表是最简单的交互分类表。n n rc rc列联表列联表列联表列联表 r(row) r(row)、c(column)c(column)7/27/20249 rc频数分布列联表的一般形式频数分布列联表的一般形式7/27/202410自己志愿自己志愿自己志愿自己志愿知心朋友志愿知心朋友志愿知心朋友志愿知心朋友志愿总数总数总数总数快乐家快乐家快乐家快乐家庭庭庭庭理想工理想工理想工理想工作作作作增广见增广见增广见增广见

18、闻闻闻闻快乐家庭快乐家庭快乐家庭快乐家庭28289 93 34040理想工作理想工作理想工作理想工作2 241417 75050增广见闻增广见闻增广见闻增广见闻2 24 44 41010总数总数总数总数3232545414141001007/27/202411两个边际分布:两个边际分布:两个边际分布:两个边际分布:7/27/202412n n 条件频数表中各频数因基数不同不便作直接比较,因此有必要将频数化成相对频数,使基数标准化。这样,我们就从频数分布的列联表得到了相对频数分布的列联表(或称频率分布的列联表)。下表是rc相对频数分布列联表的一般形式。7/27/202413 rc相对频数分布列联

19、表的一般形式相对频数分布列联表的一般形式7/27/202414 在相对频数分布列联表中,各数据为各分类在相对频数分布列联表中,各数据为各分类在相对频数分布列联表中,各数据为各分类在相对频数分布列联表中,各数据为各分类出现的相对频数出现的相对频数出现的相对频数出现的相对频数( (或者频率或者频率或者频率或者频率) )。将频数。将频数。将频数。将频数 化成相对化成相对化成相对化成相对频数频数频数频数 有两种做法:有两种做法:有两种做法:有两种做法: 相对频数联合分布相对频数联合分布相对频数联合分布相对频数联合分布 两个边际分布两个边际分布两个边际分布两个边际分布 或或或或相对频数条件分布相对频数条

20、件分布相对频数条件分布相对频数条件分布 或或或或7/27/202415 rc相对频数联合分布列联表相对频数联合分布列联表7/27/202416控制控制X,Y相对频数条件分布列联表相对频数条件分布列联表7/27/202417控制控制Y,X相对频数条件分布列联表相对频数条件分布列联表7/27/202418 例例例例A1A1试把下表所示的频数分布列联表,转试把下表所示的频数分布列联表,转试把下表所示的频数分布列联表,转试把下表所示的频数分布列联表,转化为自变量受到控制的相对频数条件分布列联化为自变量受到控制的相对频数条件分布列联化为自变量受到控制的相对频数条件分布列联化为自变量受到控制的相对频数条件

21、分布列联表,并加以相关分析。表,并加以相关分析。表,并加以相关分析。表,并加以相关分析。 投票行为投票行为Y Y受教育程度受教育程度X X 大学以大学以上上 大学以大学以下下投票投票弃权弃权160160 7 7129129 61 61289289 68 68合计:合计:1671671901903573577/27/202419 从上表可知,受过大学以上教育的被调查者绝大多从上表可知,受过大学以上教育的被调查者绝大多数(占数(占95.8%95.8%)是投票的,受教育程度在大学以下的被调)是投票的,受教育程度在大学以下的被调查者虽多数也参与投票(占查者虽多数也参与投票(占67.9%67.9%),

22、,但后者参与投票的百但后者参与投票的百分比远小于前者;前者只有分比远小于前者;前者只有4.2%4.2%弃权,而后者则有弃权,而后者则有32.1%32.1%弃权。两相比较可知,受教育程度不同,参与投票的行弃权。两相比较可知,受教育程度不同,参与投票的行为不同,因此两个变量是相关的。为不同,因此两个变量是相关的。投票行为投票行为Y Y受教育程度受教育程度X X 大学以上大学以上 大学以下大学以下投票投票弃权弃权95.8%(160/167)95.8%(160/167) 4.2%(7/167) 4.2%(7/167)67.9%(129/190)67.9%(129/190) 32.1%(61/190)

23、32.1%(61/190)81.0%(289/357)81.0%(289/357) 19.0%(68/357) 19.0%(68/357)100.0%100.0%(167)(167)100.0%100.0%(190)(190)100.0%100.0%(357)(357)7/27/202420 例例例例A2A2试把下表所示的频数分布列联表,转试把下表所示的频数分布列联表,转试把下表所示的频数分布列联表,转试把下表所示的频数分布列联表,转化为相对频数条件分布列联表和自变量受到控制化为相对频数条件分布列联表和自变量受到控制化为相对频数条件分布列联表和自变量受到控制化为相对频数条件分布列联表和自变量受

24、到控制的相对频数条件分布列联表,并加以相关分析。的相对频数条件分布列联表,并加以相关分析。的相对频数条件分布列联表,并加以相关分析。的相对频数条件分布列联表,并加以相关分析。 投票行为投票行为Y Y受教育程度受教育程度X X 大学以大学以上上 大学以大学以下下投票投票弃权弃权100100 67 67114114 76 76214214143143合计:合计:1671671901903573577/27/202421 上表显示,大学以上文化程度和大学以下文化程度同样上表显示,大学以上文化程度和大学以下文化程度同样各有各有60%60%的人参与投票,的人参与投票,40%40%的人弃权,并没有因为受教

25、育的人弃权,并没有因为受教育程度不同,而使参与投票的行为有所不同。因此,此时的两程度不同,而使参与投票的行为有所不同。因此,此时的两个变量是不相关的,或者说是独立的。我们不难发现,此时个变量是不相关的,或者说是独立的。我们不难发现,此时反映全体投票情况的相对频数的边际分布反映全体投票情况的相对频数的边际分布( )( )也各有也各有60%60%的人参与投票,的人参与投票,40%40%的人弃权。的人弃权。投票行为投票行为Y Y受教育程度受教育程度X X 大学以上大学以上 大学以下大学以下投票投票弃权弃权60.0%(100/167)60.0%(100/167) 40.0%(67/167) 40.0%

26、(67/167)60.0%(114/190)60.0%(114/190) 40.0%(76/190) 40.0%(76/190)60.0%(214/357)60.0%(214/357)40.0%(143/357)40.0%(143/357)100.0%100.0%(167)(167)100.0%100.0%(190)(190)100.0%100.0%(357)(357)7/27/202422 上表显示,当两个变量不相关时有上表显示,当两个变量不相关时有 。如如0.532 0.40=0.2130.532 0.40=0.213。投票行为投票行为Y Y受教育程度受教育程度X X 大学以上大学以上 大

27、学以下大学以下投票投票弃权弃权28.0%(100/357)28.0%(100/357) 18.8%(67/357) 18.8%(67/357)31.9%(114/357)31.9%(114/357) 21.3%(76/357) 21.3%(76/357)60.0%(214/357)60.0%(214/357)40.0%(143/357)40.0%(143/357)46.8%46.8%(167/357)(167/357)53.2%53.2%(190/357)(190/357)100.0%100.0%(357)(357)7/27/202423 例例例例BB某社区调查了某社区调查了某社区调查了某社区

28、调查了120120名市民,考察性别与名市民,考察性别与名市民,考察性别与名市民,考察性别与对吸烟态度之间的关系,试将所得资料作成相对对吸烟态度之间的关系,试将所得资料作成相对对吸烟态度之间的关系,试将所得资料作成相对对吸烟态度之间的关系,试将所得资料作成相对频数的联合分布、边际分布和条件分布列联表,频数的联合分布、边际分布和条件分布列联表,频数的联合分布、边际分布和条件分布列联表,频数的联合分布、边际分布和条件分布列联表,并进行相关分析。并进行相关分析。并进行相关分析。并进行相关分析。 性别与对吸烟的态度性别与对吸烟的态度性别与对吸烟的态度性别与对吸烟的态度态度态度态度态度Y Y性别性别性别性

29、别X X合计合计合计合计男男男男女女女女容忍容忍容忍容忍48488 85656反对反对反对反对202044446464合计合计合计合计686852521201207/27/202424相对频数联合分布列联表相对频数联合分布列联表相对频数联合分布列联表相对频数联合分布列联表态度态度态度态度Y Y性别性别性别性别X X男男男男( X( X1 1 ) )女女女女( X( X2 2 ) )容忍容忍容忍容忍Y Y1 140.0%40.0% 6.7 % 6.7 %46.7 %46.7 %反对反对反对反对Y Y2 216.7 %16.7 %36.6 %36.6 %53.3 %53.3 %56.7 %56.7

30、 %43.3%43.3%100 % (120)100 % (120)7/27/202425相对频数条件分布列联表相对频数条件分布列联表相对频数条件分布列联表相对频数条件分布列联表态度态度态度态度Y Y性别性别性别性别X X男男男男( )( )女女女女( )( )容忍容忍容忍容忍70.6%70.6%15.4 %15.4 %46.7 %(56)46.7 %(56)反对反对反对反对29.4 %29.4 %84.6 %84.6 %53.3 %(64)53.3 %(64)100 %100 %(68)(68)100 %100 %(52)(52)100 %100 %(120)(120)7/27/202426

31、26752675名双亲和他们名双亲和他们名双亲和他们名双亲和他们1007110071个子女个子女个子女个子女的智力的关系的智力的关系的智力的关系的智力的关系(%)(%)( (相对频数条件分布列联表相对频数条件分布列联表) ) 父母智力父母智力 组合组合 子女智力子女智力 优秀优秀 子女智力子女智力 一般一般 子女智力子女智力 低下低下 优优优优 71.6 25.4 3.0 优劣优劣 33.6 42.7 23.7 一般一般一般一般 18.6 66.9 14.5 劣劣劣劣 5.4 34.4 60.27/27/202427 通过列联表研究定类变量之间的关联性,这通过列联表研究定类变量之间的关联性,这

32、实际上是通过相对频数条件分布的比较进行的。实际上是通过相对频数条件分布的比较进行的。如果对不同的如果对不同的X X,Y Y的相对频数条件分布不同,且的相对频数条件分布不同,且和和Y Y的相对频数边际分布不同,则两变量之间是的相对频数边际分布不同,则两变量之间是相关的。而如果变量间是相互独立的话,必然存相关的。而如果变量间是相互独立的话,必然存在着在着Y Y的相对频数条件分布相同,且和它的相对的相对频数条件分布相同,且和它的相对频数边际分布相同。后者用数学式表示就是频数边际分布相同。后者用数学式表示就是 或者或者 7/27/2024282. 2. 2. 2. 削减误差比例削减误差比例削减误差比例

33、削减误差比例 PRE PRE PRE PRE(Proportionate Reduction in Error) Proportionate Reduction in Error) n n 通过相对频数条件分布列联表的讨论,可以就自变量通过相对频数条件分布列联表的讨论,可以就自变量通过相对频数条件分布列联表的讨论,可以就自变量通过相对频数条件分布列联表的讨论,可以就自变量X X和因变量和因变量和因变量和因变量Y Y的关联性给出一个初步的判断。但是对关联的关联性给出一个初步的判断。但是对关联的关联性给出一个初步的判断。但是对关联的关联性给出一个初步的判断。但是对关联性给出判断,肯定没有用量化指标

34、表达来得好。所以,下性给出判断,肯定没有用量化指标表达来得好。所以,下性给出判断,肯定没有用量化指标表达来得好。所以,下性给出判断,肯定没有用量化指标表达来得好。所以,下面我们将关注于如何用统计方法,使相关关系的强弱可以面我们将关注于如何用统计方法,使相关关系的强弱可以面我们将关注于如何用统计方法,使相关关系的强弱可以面我们将关注于如何用统计方法,使相关关系的强弱可以通过某些简单的系数明确地表达出来。通过某些简单的系数明确地表达出来。通过某些简单的系数明确地表达出来。通过某些简单的系数明确地表达出来。n n 在社会统计中,表达相关关系的强弱,削减误差比在社会统计中,表达相关关系的强弱,削减误差

35、比在社会统计中,表达相关关系的强弱,削减误差比在社会统计中,表达相关关系的强弱,削减误差比例的概念是非常有价值的。削减误差比例的原理是,如果例的概念是非常有价值的。削减误差比例的原理是,如果例的概念是非常有价值的。削减误差比例的原理是,如果例的概念是非常有价值的。削减误差比例的原理是,如果两变量间存在着一定的关联性,那么知道这种关联性,必两变量间存在着一定的关联性,那么知道这种关联性,必两变量间存在着一定的关联性,那么知道这种关联性,必两变量间存在着一定的关联性,那么知道这种关联性,必然有助于我们通过一个变量去预测另一变量。其中关系密然有助于我们通过一个变量去预测另一变量。其中关系密然有助于我

36、们通过一个变量去预测另一变量。其中关系密然有助于我们通过一个变量去预测另一变量。其中关系密切者,在由一变量预测另一变量时,盲目性必然较关系不切者,在由一变量预测另一变量时,盲目性必然较关系不切者,在由一变量预测另一变量时,盲目性必然较关系不切者,在由一变量预测另一变量时,盲目性必然较关系不密切者为小。密切者为小。密切者为小。密切者为小。7/27/202429 PRE:用不知道用不知道Y与与X有关系时预测有关系时预测Y的全部误差的全部误差E1,减去知道,减去知道Y与与X有关系时预测有关系时预测Y的联系误差的联系误差E2,再将其化,再将其化为比例来度量为比例来度量 PRE的取值范围是的取值范围是

37、0PREl 削减误差比例削减误差比例PRE适用于各测量层次的变量,适用于各测量层次的变量,系数系数和和系数便是在定类测量的层次上以削减误差比例系数便是在定类测量的层次上以削减误差比例PRE为为基础所设计的两种相关系数。基础所设计的两种相关系数。 7/27/202430PRE=(56-28)/56=0.5态度态度态度态度Y Y性别性别性别性别X X合计合计合计合计男男男男女女女女容忍容忍容忍容忍48488 85656反对反对反对反对202044446464合计合计合计合计686852521201207/27/2024313. 3. 3. 3. 系数系数系数系数 在定类尺度上测量集中趋势只能用众数

38、。在定类尺度上测量集中趋势只能用众数。在定类尺度上测量集中趋势只能用众数。在定类尺度上测量集中趋势只能用众数。 系数就是利用此性质来构造相关系数的。系数就是利用此性质来构造相关系数的。系数就是利用此性质来构造相关系数的。系数就是利用此性质来构造相关系数的。(1 1 1 1)不对称的)不对称的)不对称的)不对称的系数系数系数系数7/27/202432 例例例例 对下表所示资料,用对下表所示资料,用对下表所示资料,用对下表所示资料,用 系数反映性别与收系数反映性别与收系数反映性别与收系数反映性别与收入高低的相关关系。入高低的相关关系。入高低的相关关系。入高低的相关关系。收入收入收入收入Y Y性别性

39、别性别性别X X合计合计合计合计男男男男女女女女低低低低6060150150210210高高高高1201207070190190合计合计合计合计1801802202204004007/27/2024337/27/202434(2 2)对称的)对称的)对称的)对称的 系数系数系数系数7/27/202435 例例例例 研究工作类别与工作价值的关系,工研究工作类别与工作价值的关系,工研究工作类别与工作价值的关系,工研究工作类别与工作价值的关系,工作类别可分为三类:工人、技术人员、管理作类别可分为三类:工人、技术人员、管理作类别可分为三类:工人、技术人员、管理作类别可分为三类:工人、技术人员、管理/

40、/行行行行政人员;工作价值也可分为三类:以收入政人员;工作价值也可分为三类:以收入政人员;工作价值也可分为三类:以收入政人员;工作价值也可分为三类:以收入/ /福利福利福利福利为最重要的职业选择标准的称为经济取向型,以为最重要的职业选择标准的称为经济取向型,以为最重要的职业选择标准的称为经济取向型,以为最重要的职业选择标准的称为经济取向型,以工作的创造性、挑战性为最重要的职业选择标准工作的创造性、挑战性为最重要的职业选择标准工作的创造性、挑战性为最重要的职业选择标准工作的创造性、挑战性为最重要的职业选择标准的称为成就取向型,以工作中的人际关系为最重的称为成就取向型,以工作中的人际关系为最重的称

41、为成就取向型,以工作中的人际关系为最重的称为成就取向型,以工作中的人际关系为最重要的职业选择标准的称为人际关系取向型。对下要的职业选择标准的称为人际关系取向型。对下要的职业选择标准的称为人际关系取向型。对下要的职业选择标准的称为人际关系取向型。对下表所示资料,用表所示资料,用表所示资料,用表所示资料,用 系数反映工作类别与工作价值系数反映工作类别与工作价值系数反映工作类别与工作价值系数反映工作类别与工作价值的相关关系的相关关系的相关关系的相关关系 。7/27/202436 职工的工作种类与工作价值职工的工作种类与工作价值职工的工作种类与工作价值职工的工作种类与工作价值 工作价值工作价值工作价值

42、工作价值 Y Y工作种类工作种类工作种类工作种类 X X合计合计合计合计 工人工人工人工人 技术人员技术人员技术人员技术人员 管理管理管理管理/ /行行行行政人员政人员政人员政人员经济取向型经济取向型经济取向型经济取向型成就取向型成就取向型成就取向型成就取向型人际关系取向人际关系取向人际关系取向人际关系取向型型型型100100 30 30 20 207070606010105050202040402202201101107070合计:合计:合计:合计:F FX X1501501401401101104004007/27/2024377/27/202438 性质:性质:性质:性质: (1 1)0

43、101 (2 2)具有)具有)具有)具有PREPRE意义。意义。意义。意义。 (3 3)对称与不对称情况下,有不同的公式。)对称与不对称情况下,有不同的公式。)对称与不对称情况下,有不同的公式。)对称与不对称情况下,有不同的公式。 (4 4)以众数作为预测的准则,对条件频数分)以众数作为预测的准则,对条件频数分)以众数作为预测的准则,对条件频数分)以众数作为预测的准则,对条件频数分布列联表中众数频数以外的条件频数不予理会。布列联表中众数频数以外的条件频数不予理会。布列联表中众数频数以外的条件频数不予理会。布列联表中众数频数以外的条件频数不予理会。 (5 5)如果众数频数集中在条件频数分布列联)

44、如果众数频数集中在条件频数分布列联)如果众数频数集中在条件频数分布列联)如果众数频数集中在条件频数分布列联表的同一行时,表的同一行时,表的同一行时,表的同一行时,=0=0,从而无法显示两变量之间,从而无法显示两变量之间,从而无法显示两变量之间,从而无法显示两变量之间的相关性。的相关性。的相关性。的相关性。 7/27/2024394.4.4.4.系数系数系数系数n n 系数的统计值域是系数的统计值域是系数的统计值域是系数的统计值域是0000,1111,其特点是在计,其特点是在计,其特点是在计,其特点是在计算时考虑所有的边际频数和条件频数算时考虑所有的边际频数和条件频数算时考虑所有的边际频数和条件

45、频数算时考虑所有的边际频数和条件频数 。n n 注意:当众数很突出且众数分布不在同一行,同一注意:当众数很突出且众数分布不在同一行,同一注意:当众数很突出且众数分布不在同一行,同一注意:当众数很突出且众数分布不在同一行,同一列时,用列时,用列时,用列时,用系数较好;但当众数不突出时,用系数较好;但当众数不突出时,用系数较好;但当众数不突出时,用系数较好;但当众数不突出时,用系数更系数更系数更系数更好;若众数集中在某一行或某一列,一定用好;若众数集中在某一行或某一列,一定用好;若众数集中在某一行或某一列,一定用好;若众数集中在某一行或某一列,一定用系数。系数。系数。系数。7/27/202440

46、例例例例 对下表所示资料,用对下表所示资料,用对下表所示资料,用对下表所示资料,用 系数反映性别与系数反映性别与系数反映性别与系数反映性别与收入高低的相关关系,并对系数的收入高低的相关关系,并对系数的收入高低的相关关系,并对系数的收入高低的相关关系,并对系数的PREPRE意义加以意义加以意义加以意义加以解释。解释。解释。解释。 收入收入收入收入Y Y性别性别性别性别X X合计合计合计合计男男男男女女女女低低低低6060150150210210高高高高1201207070190190合计合计合计合计1801802202204004007/27/202441n n 7/27/202442练习练习:

47、 调查调查调查调查100100名青年人与其知心朋友的志愿,条名青年人与其知心朋友的志愿,条名青年人与其知心朋友的志愿,条名青年人与其知心朋友的志愿,条件次数分布如下:计算知心朋友的志愿与自己志件次数分布如下:计算知心朋友的志愿与自己志件次数分布如下:计算知心朋友的志愿与自己志件次数分布如下:计算知心朋友的志愿与自己志愿之间的相关关系,并提出研究结论。愿之间的相关关系,并提出研究结论。愿之间的相关关系,并提出研究结论。愿之间的相关关系,并提出研究结论。自己志愿自己志愿自己志愿自己志愿知心朋友志愿知心朋友志愿知心朋友志愿知心朋友志愿总数总数总数总数快乐快乐快乐快乐家庭家庭家庭家庭理想工理想工理想工

48、理想工作作作作增广增广增广增广见闻见闻见闻见闻快乐家庭快乐家庭快乐家庭快乐家庭28289 93 34040理想工作理想工作理想工作理想工作2 241417 75050增广见闻增广见闻增广见闻增广见闻2 24 44 41010总数总数总数总数3232545414141001007/27/202443第三节第三节 定序变量的相关分析定序变量的相关分析 定序变量只能排列高低次序,因而在分析时只能考虑定序变量只能排列高低次序,因而在分析时只能考虑定序变量只能排列高低次序,因而在分析时只能考虑定序变量只能排列高低次序,因而在分析时只能考虑两变量变化的顺序是否一致及其等级之间的差距。以此来两变量变化的顺序

49、是否一致及其等级之间的差距。以此来两变量变化的顺序是否一致及其等级之间的差距。以此来两变量变化的顺序是否一致及其等级之间的差距。以此来计算两变量的相关系数。计算两变量的相关系数。计算两变量的相关系数。计算两变量的相关系数。 1 1、同序对、异序对和同分对、同序对、异序对和同分对、同序对、异序对和同分对、同序对、异序对和同分对 2 2、GammaGamma等级相关系数等级相关系数等级相关系数等级相关系数 3 3、肯德尔等级相关系数、肯德尔等级相关系数、肯德尔等级相关系数、肯德尔等级相关系数 4 4、萨默斯系数(、萨默斯系数(、萨默斯系数(、萨默斯系数(d d系数)系数)系数)系数) 5 5、 S

50、pearman Spearman等级相关系数等级相关系数等级相关系数等级相关系数 6 6、肯德尔和谐系数、肯德尔和谐系数、肯德尔和谐系数、肯德尔和谐系数7/27/2024441. 1. 同序对、异序对、同分对同序对、异序对、同分对同序对、异序对、同分对同序对、异序对、同分对 社会学研究常用的两定序变量的相关测量社会学研究常用的两定序变量的相关测量法,有一类是以同序对、异序对、同分对的概念法,有一类是以同序对、异序对、同分对的概念为基础的,如为基础的,如GammaGamma系数、肯德尔系数、系数、肯德尔系数、d d系数系数等。所以我们在讨论这几种相关系数之前,先来等。所以我们在讨论这几种相关系数

51、之前,先来了解这三个概念。了解这三个概念。7/27/202445 在定序相关测量中,首先要搞清楚在定序相关测量中,首先要搞清楚“次序对(次序对(pairpair)”的概念。例如,的概念。例如,假设假设研究员工的工作满足感与归属感的关系,将工作满足感从低到高,分为低研究员工的工作满足感与归属感的关系,将工作满足感从低到高,分为低(1 1)、中()、中(2 2)和高()和高(3 3)三个级别,归属感也从低到高分为低()三个级别,归属感也从低到高分为低(1 1)、中)、中(2 2)和高()和高(3 3)三个级别。下表列示的是)三个级别。下表列示的是5 5名被访者名被访者A A、B B、C C、D D

52、、E E的情况。的情况。单元单元单元单元X XY YA A1 12 2B B1 12 2C C1 13 3D D2 23 3E E3 31 17/27/202446n n同序对同序对同序对同序对 参见上表(注意,为了容易识别各种次序对,该表已参见上表(注意,为了容易识别各种次序对,该表已参见上表(注意,为了容易识别各种次序对,该表已参见上表(注意,为了容易识别各种次序对,该表已先将被访者按定序变量先将被访者按定序变量先将被访者按定序变量先将被访者按定序变量X X由低到高作了排列),在观察由低到高作了排列),在观察由低到高作了排列),在观察由低到高作了排列),在观察X X序列时如果我们看到序列时

53、如果我们看到序列时如果我们看到序列时如果我们看到X Xi i X Xj j ,在,在,在,在Y Y序列中看到的是序列中看到的是序列中看到的是序列中看到的是Y Yi i Y Yj j,则称这一配对是同序对。同序对只要求,则称这一配对是同序对。同序对只要求,则称这一配对是同序对。同序对只要求,则称这一配对是同序对。同序对只要求X X变化方向和变化方向和变化方向和变化方向和Y Y变化方向相同,并不要求变化方向相同,并不要求变化方向相同,并不要求变化方向相同,并不要求X X变化大小和变化大小和变化大小和变化大小和Y Y变化大小相等。变化大小相等。变化大小相等。变化大小相等。同序对的总数用符号同序对的总

54、数用符号同序对的总数用符号同序对的总数用符号n ns s表示。表示。表示。表示。n n异序对异序对异序对异序对 见上表,在观察见上表,在观察见上表,在观察见上表,在观察X X序列时如果我们看到序列时如果我们看到序列时如果我们看到序列时如果我们看到X Xi i X Xj j ,在,在,在,在Y Y序列中看到的是序列中看到的是序列中看到的是序列中看到的是Y Yi i Y Yj j,则称这一配对是异序对。同样,则称这一配对是异序对。同样,则称这一配对是异序对。同样,则称这一配对是异序对。同样,异序对只要求异序对只要求异序对只要求异序对只要求X X变化方向和变化方向和变化方向和变化方向和Y Y变化方向

55、相同,并不要求变化方向相同,并不要求变化方向相同,并不要求变化方向相同,并不要求X X变变变变化大小和化大小和化大小和化大小和Y Y变化大小相等。同序对的总数用符号变化大小相等。同序对的总数用符号变化大小相等。同序对的总数用符号变化大小相等。同序对的总数用符号n nd d表示。表示。表示。表示。7/27/202447n n同分对同分对同分对同分对 如果在如果在如果在如果在X X序列中,我们观察到序列中,我们观察到序列中,我们观察到序列中,我们观察到X Xi i X Xj j ( (此时在此时在此时在此时在Y Y序列中序列中序列中序列中无无无无Y Yi i Y Yj j) ),则这个配对仅是,则

56、这个配对仅是,则这个配对仅是,则这个配对仅是X X方向上而非方向上而非方向上而非方向上而非Y Y 方向上的同分方向上的同分方向上的同分方向上的同分对;对;对;对;X X 的这种同分对用符号的这种同分对用符号的这种同分对用符号的这种同分对用符号n nx x表示。如果在表示。如果在表示。如果在表示。如果在Y Y 序列中,我序列中,我序列中,我序列中,我们观察到们观察到们观察到们观察到Y Yi i Y Yj j( (此时在此时在此时在此时在X X序列中无序列中无序列中无序列中无X Xi i X Xj j ) ),则这个配对,则这个配对,则这个配对,则这个配对仅是仅是仅是仅是Y Y 方向上而非方向上而

57、非方向上而非方向上而非X X方向上的同分对;方向上的同分对;方向上的同分对;方向上的同分对;Y Y 的这种同分对用符的这种同分对用符的这种同分对用符的这种同分对用符号号号号n ny y表示。如果我们观察到表示。如果我们观察到表示。如果我们观察到表示。如果我们观察到 X Xi i X Xj j时,也观察到时,也观察到时,也观察到时,也观察到Y Yi i Y Yj j ,则称这两个配对为则称这两个配对为则称这两个配对为则称这两个配对为X X与与与与Y Y 同分对,以符号同分对,以符号同分对,以符号同分对,以符号n nxyxy表示。表示。表示。表示。X X 同分对同分对同分对同分对的总数用符号的总数

58、用符号的总数用符号的总数用符号T Tx x表示,表示,表示,表示, T Tx x n nx x + n + nxyxy ;Y Y 同分对的总数用同分对的总数用同分对的总数用同分对的总数用符号符号符号符号T Ty y表示表示表示表示, T, Ty y n ny y + n + nxyxy 。 n n个单位两两配对,总对数个单位两两配对,总对数个单位两两配对,总对数个单位两两配对,总对数 n ns s + n + nd d + n + nx x + + n ny y + n + nxyxy 7/27/202448 计算Gamma系数,肯得尔系数、 d系数等,我们面对的经常是两定序变量已形成列联表的

59、资料,所以对我们来说很重要的是要学会定序变量列联表中这五种“次序对”的计算和识别。 同序对:“右下余子式”法 异序对:“左下余子式”法 7/27/202449高高高高中中中中低低低低高高高高8 84 43 3中中中中6 65 51 1低低低低4 44 45 5 工作满足感与归属感工作满足感与归属感 7/27/2024502. Gamma2. Gamma系数系数系数系数性质:性质:性质:性质:(1 1)取值范围)取值范围)取值范围)取值范围-1-1,11(2 2)具有)具有)具有)具有PREPRE意义意义意义意义(3 3)属)属)属)属对称相关对称相关对称相关对称相关测量。测量。测量。测量。(4

60、 4)不考虑同分对。)不考虑同分对。)不考虑同分对。)不考虑同分对。7/27/202451 例:在某市例:在某市例:在某市例:在某市200200户中调查,看住户人口密户中调查,看住户人口密户中调查,看住户人口密户中调查,看住户人口密度与婆媳冲突是否有关,交互分类后分布如度与婆媳冲突是否有关,交互分类后分布如度与婆媳冲突是否有关,交互分类后分布如度与婆媳冲突是否有关,交互分类后分布如下,计算下,计算下,计算下,计算GG相关系数并提出研究结论。相关系数并提出研究结论。相关系数并提出研究结论。相关系数并提出研究结论。婆媳婆媳婆媳婆媳冲突冲突冲突冲突住户密度住户密度住户密度住户密度总数总数总数总数高高

61、高高中中中中低低低低高高高高232320204 44949中中中中1111555528289494低低低低8 8272724245959总数总数总数总数424210210256562002007/27/2024523. 3. 肯德尔等级相关系数肯德尔等级相关系数肯德尔等级相关系数肯德尔等级相关系数(1)Tau-a (1)Tau-a 系数系数系数系数 适用于不存在任何同分对的情况。适用于不存在任何同分对的情况。适用于不存在任何同分对的情况。适用于不存在任何同分对的情况。 7/27/202453 某市有某市有某市有某市有12 12 所大专院校,现组织一个评审委员会所大专院校,现组织一个评审委员会所

62、大专院校,现组织一个评审委员会所大专院校,现组织一个评审委员会对各院校校园环境及学生体质进行评价,评价结果对各院校校园环境及学生体质进行评价,评价结果对各院校校园环境及学生体质进行评价,评价结果对各院校校园环境及学生体质进行评价,评价结果如表(表中已先将学校按如表(表中已先将学校按如表(表中已先将学校按如表(表中已先将学校按X X作了次序排列)所示,作了次序排列)所示,作了次序排列)所示,作了次序排列)所示,试计算校园环境和学生体质关系的肯德尔相关系试计算校园环境和学生体质关系的肯德尔相关系试计算校园环境和学生体质关系的肯德尔相关系试计算校园环境和学生体质关系的肯德尔相关系数。数。数。数。 学

63、校名学校名学校名学校名 A B C D E F G H I J A B C D E F G H I J 环环境名次(境名次(境名次(境名次(X X) 体体体体质质名次(名次(名次(名次(Y Y) 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 2 1 5 3 7 4 6 8 10 9 2 1 5 3 7 4 6 8 10 9 7/27/202454(2 2)Tau-bTau-b系数系数系数系数 当出现同分对时,对分母进行修正。与当出现同分对时,对分母进行修正。与当出现同分对时,对分母进行修正。与当出现同分对时,对分母进行修正。与G G系系系系数一样,数一样,

64、数一样,数一样, Tau-b Tau-b系数也具有消减误差比例的意系数也具有消减误差比例的意系数也具有消减误差比例的意系数也具有消减误差比例的意义。义。义。义。 Tau-b Tau-b系数的特殊性在于,只有在列联表的系数的特殊性在于,只有在列联表的系数的特殊性在于,只有在列联表的系数的特殊性在于,只有在列联表的行数与列数相同(行数与列数相同(行数与列数相同(行数与列数相同(r r= =c c)的情况下,其系数值才)的情况下,其系数值才)的情况下,其系数值才)的情况下,其系数值才可能是可能是可能是可能是-1-1或或或或+1+1,否则便不确定。,否则便不确定。,否则便不确定。,否则便不确定。 7/

65、27/202455(3)Tau-c系数系数 当同分对很多时,且当同分对很多时,且rc ,可以用,可以用Tau-c系数来测量。系数来测量。 m取取rc列联表列联表 中中r和和c值较小者。值较小者。 Tau-c系数没有消减误差比例的意义。系数没有消减误差比例的意义。 7/27/2024564. 4. 萨默斯萨默斯萨默斯萨默斯 (d d系数)系数)系数)系数) 萨默尔斯提出的,对萨默尔斯提出的,对萨默尔斯提出的,对萨默尔斯提出的,对GG系数进行修正。系数进行修正。系数进行修正。系数进行修正。 d d系数具有系数具有系数具有系数具有PREPRE意义,取值意义,取值意义,取值意义,取值-1-1,11,为

66、不对称测量。,为不对称测量。,为不对称测量。,为不对称测量。 7/27/2024575. Spearman5. Spearman等级相关系数等级相关系数等级相关系数等级相关系数 运用上式计算等级相关系数很简便:首先将定序变运用上式计算等级相关系数很简便:首先将定序变运用上式计算等级相关系数很简便:首先将定序变运用上式计算等级相关系数很简便:首先将定序变量量量量X X和和和和Y Y的数值形成对应的两个序数数列的数值形成对应的两个序数数列的数值形成对应的两个序数数列的数值形成对应的两个序数数列( (其中先将其中先将其中先将其中先将X X由小由小由小由小到大排到大排到大排到大排) )。如遇有相等的数

67、值时,则应将原有的等级求其。如遇有相等的数值时,则应将原有的等级求其。如遇有相等的数值时,则应将原有的等级求其。如遇有相等的数值时,则应将原有的等级求其平均数,让它们以这平均等级并列。然后求出等级差,平均数,让它们以这平均等级并列。然后求出等级差,平均数,让它们以这平均等级并列。然后求出等级差,平均数,让它们以这平均等级并列。然后求出等级差,经平方后求和,运用上式即可求得斯皮尔曼等级相关系经平方后求和,运用上式即可求得斯皮尔曼等级相关系经平方后求和,运用上式即可求得斯皮尔曼等级相关系经平方后求和,运用上式即可求得斯皮尔曼等级相关系数。数。数。数。 例:为了解活动能力与智商是否有关,作了例:为了

68、解活动能力与智商是否有关,作了例:为了解活动能力与智商是否有关,作了例:为了解活动能力与智商是否有关,作了1010名名名名同学的抽样调查,资料如表,问这同学的抽样调查,资料如表,问这同学的抽样调查,资料如表,问这同学的抽样调查,资料如表,问这1010名同学的智商与活名同学的智商与活名同学的智商与活名同学的智商与活动能力是否有关。动能力是否有关。动能力是否有关。动能力是否有关。7/27/202458学生学生学生学生活动能力名次活动能力名次活动能力名次活动能力名次智商智商智商智商智商名次智商名次智商名次智商名次A A1 11101103 3B B2 21101103 3C C3 31051056

69、6D D4 495959 9E E5 51201201 1F F6 694941010GG7 71001008 8HH8 81051056 6I I9 91051056 6J J10101101103 37/27/2024596. 6. 肯德尔和谐系数肯德尔和谐系数肯德尔和谐系数肯德尔和谐系数 前面我们谈的都是对双变量求等级相关系前面我们谈的都是对双变量求等级相关系前面我们谈的都是对双变量求等级相关系前面我们谈的都是对双变量求等级相关系数。对于多变量求等级相关系数,如多个专家数。对于多变量求等级相关系数,如多个专家数。对于多变量求等级相关系数,如多个专家数。对于多变量求等级相关系数,如多个专家

70、对同一事物评价的一致性或相关程度的衡量,对同一事物评价的一致性或相关程度的衡量,对同一事物评价的一致性或相关程度的衡量,对同一事物评价的一致性或相关程度的衡量,肯德尔运用数理分析方法,提出了一个计算公肯德尔运用数理分析方法,提出了一个计算公肯德尔运用数理分析方法,提出了一个计算公肯德尔运用数理分析方法,提出了一个计算公式式式式7/27/202460 假设四位专家对假设四位专家对假设四位专家对假设四位专家对1010所大专院校环境质量进行排序,所大专院校环境质量进行排序,所大专院校环境质量进行排序,所大专院校环境质量进行排序,有关评价结果列于下表中,试通过计算肯德尔和谐系有关评价结果列于下表中,试

71、通过计算肯德尔和谐系有关评价结果列于下表中,试通过计算肯德尔和谐系有关评价结果列于下表中,试通过计算肯德尔和谐系数,检验专家意见的一致性和相关程度。数,检验专家意见的一致性和相关程度。数,检验专家意见的一致性和相关程度。数,检验专家意见的一致性和相关程度。 专专家家家家名名名名 大大大大专专院校名院校名院校名院校名 合合合合计计A B C D E F G H I JA B C D E F G H I J A A B B C C D D 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 3 2 1 4 5 8 6 7 10 9 3 2 1 4 5 8 6 7 1

72、0 9 1 3 2 4 5 7 6 8 9 10 1 3 2 4 5 7 6 8 9 10 4 2 1 5 3 7 8 6 10 9 4 2 1 5 3 7 8 6 10 9 等等等等级级和和和和R R R R2 29 9 7 17 18 28 27 29 38 389 9 7 17 18 28 27 29 38 38 81 81 49 289 324 784 729 841 1444 1444 81 81 49 289 324 784 729 841 1444 1444 6066 60667/27/202461 例:通过对例:通过对1500多名青年作社会调查,多名青年作社会调查,探讨当代青年

73、择业倾向与对社会经济生活探讨当代青年择业倾向与对社会经济生活的基本态度,得资料如表,求等级相关系的基本态度,得资料如表,求等级相关系数(当代青年择业倾向与他们对职业社会数(当代青年择业倾向与他们对职业社会地位的等级认定的关系;择业倾向与他们地位的等级认定的关系;择业倾向与他们对职业的富裕程度认定的关系)。对职业的富裕程度认定的关系)。7/27/202462职业职业职业职业等级认为等级认为等级认为等级认为社会地位社会地位社会地位社会地位富裕程度富裕程度富裕程度富裕程度择业理想择业理想择业理想择业理想行政事业行政事业行政事业行政事业1 1 5 52 2各类专业各类专业各类专业各类专业2 2 4 4

74、1 1企业企业企业企业3 3 3 33 3教师教师教师教师4 4 6 64 4商业商业商业商业5 5 2 25 5工人工人工人工人6 6 8 87 7个体户个体户个体户个体户7 7 1 16 6农民农民农民农民8 8 7 78 87/27/202463 试就以下单元数据,列举其中的同序试就以下单元数据,列举其中的同序对、异序对、同分对。对、异序对、同分对。单元单元单元单元X XY YA A3 32 2B B3 31 1C C3 31 1D D1 11 1E E2 23 37/27/202464 根据交互分类表计算:根据交互分类表计算:根据交互分类表计算:根据交互分类表计算:n ns s、n n

75、d d、 n nx x 、 n ny y 、 n nxy xy 、 T Tx x 、 T Ty y 、 T T(总对数)(总对数)(总对数)(总对数)高高高高中中中中低低低低高高高高f f1111f f1212f f1313中中中中f f2121f f2222f f2323低低低低f f3131f f3232f f3333高高高高中中中中低低低低高高高高101012125 5中中中中202030301010低低低低5 510105 57/27/202465 练习:练习:练习:练习:1. 1.在某地抽选在某地抽选在某地抽选在某地抽选469469名已婚男人,研究他们对父名已婚男人,研究他们对父名已

76、婚男人,研究他们对父名已婚男人,研究他们对父亲的感情是否会影响他们对婚姻的适应。试计算亲的感情是否会影响他们对婚姻的适应。试计算亲的感情是否会影响他们对婚姻的适应。试计算亲的感情是否会影响他们对婚姻的适应。试计算GG系数并系数并系数并系数并提出研究结论。提出研究结论。提出研究结论。提出研究结论。 丈夫与父亲的感情对其婚姻适度之影响丈夫与父亲的感情对其婚姻适度之影响丈夫与父亲的感情对其婚姻适度之影响丈夫与父亲的感情对其婚姻适度之影响婚姻婚姻婚姻婚姻适应适应适应适应与父亲感情与父亲感情与父亲感情与父亲感情总数总数总数总数平淡平淡平淡平淡不错不错不错不错良好良好良好良好很好很好很好很好恶劣恶劣恶劣恶

77、劣3232414126262828127127一般一般一般一般2828474741412222138138好好好好1515696961615959204204总数总数总数总数75751571571281281091094694697/27/202466 2. 2. 以下是两位评判员对以下是两位评判员对以下是两位评判员对以下是两位评判员对1010名参赛人员的打分名参赛人员的打分名参赛人员的打分名参赛人员的打分排序:试用一系数描述两评判员打分相近程度。排序:试用一系数描述两评判员打分相近程度。排序:试用一系数描述两评判员打分相近程度。排序:试用一系数描述两评判员打分相近程度。参赛人参赛人参赛人参赛

78、人 A AB BC CD DE EF FGGHHI IJ J评判评判评判评判1 11 12 24 43 35 58 87 76 69 91010评判评判评判评判2 21 12 23 34 45 56 68 87 79 910107/27/202467第四节第四节 定距变量的相关分析定距变量的相关分析 前两节,主要借助于列联表,我们解决了一前两节,主要借助于列联表,我们解决了一前两节,主要借助于列联表,我们解决了一前两节,主要借助于列联表,我们解决了一些定类、定序测量层次的相关测量问题。对于定些定类、定序测量层次的相关测量问题。对于定些定类、定序测量层次的相关测量问题。对于定些定类、定序测量层次

79、的相关测量问题。对于定距变量,根据其变量值的数学特征,我们自然可距变量,根据其变量值的数学特征,我们自然可距变量,根据其变量值的数学特征,我们自然可距变量,根据其变量值的数学特征,我们自然可以引进更为精确的量化指标来反映它们之间的相以引进更为精确的量化指标来反映它们之间的相以引进更为精确的量化指标来反映它们之间的相以引进更为精确的量化指标来反映它们之间的相关程度。两个定距变量之间的相关测量,最常用关程度。两个定距变量之间的相关测量,最常用关程度。两个定距变量之间的相关测量,最常用关程度。两个定距变量之间的相关测量,最常用的就是所谓积差系数它是由英国统计学家皮尔的就是所谓积差系数它是由英国统计学

80、家皮尔的就是所谓积差系数它是由英国统计学家皮尔的就是所谓积差系数它是由英国统计学家皮尔逊逊逊逊(Pearson)(Pearson)用积差方法推导出来,所以也称皮用积差方法推导出来,所以也称皮用积差方法推导出来,所以也称皮用积差方法推导出来,所以也称皮尔逊相关系数,用符号尔逊相关系数,用符号尔逊相关系数,用符号尔逊相关系数,用符号r r表示。表示。表示。表示。 7/27/2024681. 1. 相关表和散点图相关表和散点图相关表和散点图相关表和散点图 相关表:经整理后反映两变量之间对应关系的数据表。相关表:经整理后反映两变量之间对应关系的数据表。相关表:经整理后反映两变量之间对应关系的数据表。相

81、关表:经整理后反映两变量之间对应关系的数据表。 散点图:将相关表中各个有对应关系的数据在直角坐标散点图:将相关表中各个有对应关系的数据在直角坐标散点图:将相关表中各个有对应关系的数据在直角坐标散点图:将相关表中各个有对应关系的数据在直角坐标系上标出来,就得到散点图。散点图可以直观地观察两变系上标出来,就得到散点图。散点图可以直观地观察两变系上标出来,就得到散点图。散点图可以直观地观察两变系上标出来,就得到散点图。散点图可以直观地观察两变量之间对应关系。量之间对应关系。量之间对应关系。量之间对应关系。工龄工龄工龄工龄( (年年年年) )X X1 11 11 13 33 33 35 55 55 5

82、7 77 77 7技术考技术考技术考技术考核分核分核分核分Y Y1 12 23 32 23 34 43.53.5 4.54.5 5.55.57 78 89 97/27/202469散点图表示的相关的类型正相关正相关正相关正相关 负相关负相关负相关负相关 完全正相关完全正相关完全正相关完全正相关 完全负相关完全负相关完全负相关完全负相关 称零相关称零相关称零相关称零相关 7/27/2024702积差系数的导出和计算积差系数的导出和计算积差系数的导出和计算积差系数的导出和计算7/27/202471 r是协方差与是协方差与X和和Y的标准差的乘积之比的标准差的乘积之比7/27/202472 试就下表所

83、示资料,计算关于员工的工龄试就下表所示资料,计算关于员工的工龄试就下表所示资料,计算关于员工的工龄试就下表所示资料,计算关于员工的工龄和技术考核分的皮尔逊相关系数。和技术考核分的皮尔逊相关系数。和技术考核分的皮尔逊相关系数。和技术考核分的皮尔逊相关系数。 工龄工龄( (年年) )X X1 11 11 13 33 33 35 55 55 57 77 77 7技术考技术考核分核分Y Y1 12 23 32 23 34 43. 3.5 54. 4.5 55. 5.7 78 89 97/27/202473 N N0 0工龄工龄工龄工龄X X技术考核技术考核技术考核技术考核分分分分Y YX X 2 2Y

84、 Y 2 2XYXYXYXY 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 11 11 12 12 1 1 1 1 1 1 3 3 3 3 3 3 5 5 5 5 5 5 7 7 7 7 7 71 12 23 32 23 34 4 3.5 3.5 4.5 4.5 5.5 5.57 78 89 9 1 1 1 1 1 1 9 9 9 9 9 9 25 25 25 25 25 25 49 49 49 49 49 49 1 1 4 4 9 9 4 4 9 91616 12.25 12.25 20.25 20.25 30.25 30.25494964648181

85、1 1 2 2 3 3 6 6 9 91212 17.5 17.5 22.5 22.5 27.5 27.5494956566363 合计合计合计合计484852.552.5252252 299.75 299.75 268.5 268.57/27/202474解:计算过程见上表r=7/27/2024753 3 积差系数的性质积差系数的性质积差系数的性质积差系数的性质 (1 1) r r 是线性相关系数。是线性相关系数。是线性相关系数。是线性相关系数。 (2 2)适用于定距)适用于定距)适用于定距)适用于定距/ /定比变量。定比变量。定比变量。定比变量。 (3 3)取值)取值)取值)取值-1-1,

86、11,绝对值越大,相关程度越高。,绝对值越大,相关程度越高。,绝对值越大,相关程度越高。,绝对值越大,相关程度越高。r r 的的的的绝对值在绝对值在绝对值在绝对值在0.30.3以下表示不相关;以下表示不相关;以下表示不相关;以下表示不相关;0.30.50.30.5表示低度相关;表示低度相关;表示低度相关;表示低度相关;0.50.80.50.8表示中等相关;表示中等相关;表示中等相关;表示中等相关;0.80.8以上表示高度相关。以上表示高度相关。以上表示高度相关。以上表示高度相关。 (4 4)X X与与与与Y Y是对称关系。是对称关系。是对称关系。是对称关系。 (5 5)相关系数的数值不受坐标点

87、变化的影响。)相关系数的数值不受坐标点变化的影响。)相关系数的数值不受坐标点变化的影响。)相关系数的数值不受坐标点变化的影响。 (6 6)r r2 2具有具有具有具有PREPRE意义。意义。意义。意义。 (7 7)r r 公式中的两个变量都是随机的,因而改变两者的公式中的两个变量都是随机的,因而改变两者的公式中的两个变量都是随机的,因而改变两者的公式中的两个变量都是随机的,因而改变两者的位置并不影响位置并不影响位置并不影响位置并不影响r r的数值。的数值。的数值。的数值。 7/27/202476注意事项:注意事项:注意事项:注意事项: (1 1)注意)注意)注意)注意实际意义实际意义实际意义实

88、际意义 进行相关回归分析要有实际意义,不可把毫无关系进行相关回归分析要有实际意义,不可把毫无关系进行相关回归分析要有实际意义,不可把毫无关系进行相关回归分析要有实际意义,不可把毫无关系的两个事物或现象用来作相关回归分析的两个事物或现象用来作相关回归分析的两个事物或现象用来作相关回归分析的两个事物或现象用来作相关回归分析。例如,有人。例如,有人。例如,有人。例如,有人说,孩子长,公园里的小树也在长。求孩子和小树之间说,孩子长,公园里的小树也在长。求孩子和小树之间说,孩子长,公园里的小树也在长。求孩子和小树之间说,孩子长,公园里的小树也在长。求孩子和小树之间的相关关系就毫无意义,用孩子的身高推测小

89、树的高度的相关关系就毫无意义,用孩子的身高推测小树的高度的相关关系就毫无意义,用孩子的身高推测小树的高度的相关关系就毫无意义,用孩子的身高推测小树的高度则更加荒谬。则更加荒谬。则更加荒谬。则更加荒谬。 (2 2)注意)注意)注意)注意虚假相关虚假相关虚假相关虚假相关 两个事物间能计算出相关系数,并不一定能证明事两个事物间能计算出相关系数,并不一定能证明事两个事物间能计算出相关系数,并不一定能证明事两个事物间能计算出相关系数,并不一定能证明事物间有内在联系物间有内在联系物间有内在联系物间有内在联系,例如,有人发现,对于在校儿童,鞋,例如,有人发现,对于在校儿童,鞋,例如,有人发现,对于在校儿童,

90、鞋,例如,有人发现,对于在校儿童,鞋的大小与阅读技能有很强的相关关系。然而,学会新词的大小与阅读技能有很强的相关关系。然而,学会新词的大小与阅读技能有很强的相关关系。然而,学会新词的大小与阅读技能有很强的相关关系。然而,学会新词并不能使脚变大,而是涉及到第三个因素并不能使脚变大,而是涉及到第三个因素并不能使脚变大,而是涉及到第三个因素并不能使脚变大,而是涉及到第三个因素 年龄。当儿年龄。当儿年龄。当儿年龄。当儿童长大一些,他们的阅读能力会提高而且由于长大也穿童长大一些,他们的阅读能力会提高而且由于长大也穿童长大一些,他们的阅读能力会提高而且由于长大也穿童长大一些,他们的阅读能力会提高而且由于长

91、大也穿不下原来的鞋。不下原来的鞋。不下原来的鞋。不下原来的鞋。7/27/202477 (3 3)利用)利用)利用)利用散点图散点图散点图散点图 对于性质不明确的两组数据,可先做散点图,在图对于性质不明确的两组数据,可先做散点图,在图对于性质不明确的两组数据,可先做散点图,在图对于性质不明确的两组数据,可先做散点图,在图上看它们有无关系、关系的密切程度、是正相关还是负上看它们有无关系、关系的密切程度、是正相关还是负上看它们有无关系、关系的密切程度、是正相关还是负上看它们有无关系、关系的密切程度、是正相关还是负相关,是直线相关还是曲线相关,然后再进行相关分相关,是直线相关还是曲线相关,然后再进行相

92、关分相关,是直线相关还是曲线相关,然后再进行相关分相关,是直线相关还是曲线相关,然后再进行相关分析。析。析。析。 (4 4)注意)注意)注意)注意变量范围变量范围变量范围变量范围 相关分析和回归方程仅适用于产生样本的原始数据相关分析和回归方程仅适用于产生样本的原始数据相关分析和回归方程仅适用于产生样本的原始数据相关分析和回归方程仅适用于产生样本的原始数据范围之内,出了这个范围,两变量的相关关系和回归关范围之内,出了这个范围,两变量的相关关系和回归关范围之内,出了这个范围,两变量的相关关系和回归关范围之内,出了这个范围,两变量的相关关系和回归关系不能就此得到说明。系不能就此得到说明。系不能就此得

93、到说明。系不能就此得到说明。7/27/202478第五节第五节 回归分析回归分析 在在在在分分分分析析析析定定定定距距距距变变变变量量量量间间间间的的的的关关关关联联联联性性性性时时时时,最最最最初初初初关关关关注注注注的的的的仅仅仅仅仅仅仅仅是是是是变变变变量量量量相相相相关关关关的的的的强强强强度度度度和和和和方方方方向向向向,即即即即进进进进行行行行积积积积差差差差相相相相关关关关分分分分析析析析。然然然然而而而而积积积积差差差差系系系系数数数数并并并并不不不不能能能能表表表表明明明明X X和和和和Y Y之之之之间间间间的的的的因因因因果果果果关关关关系系系系,要要要要明明明明确确确确一

94、一一一个个个个变变变变量量量量的的的的变变变变化化化化能能能能否否否否由由由由另另另另一一一一个个个个变变变变量量量量的的的的变变变变化化化化来来来来解解解解释释释释,或或或或要要要要通通通通过过过过已已已已知知知知变变变变量量量量很很很很好好好好地地地地预预预预测测测测未未未未知知知知变变变变量量量量,就就就就要要要要进进进进行行行行回归分析。回归分析。回归分析。回归分析。 在在在在回回回回归归归归分分分分析析析析中中中中,如如如如果果果果自自自自变变变变量量量量只只只只有有有有一一一一个个个个,则则则则称称称称为为为为一一一一元元元元回回回回归归归归;如如如如果果果果自自自自变变变变量量量

95、量有有有有两两两两个个个个或或或或两两两两个个个个以以以以上上上上则则则则称称称称为为为为多多多多元元元元回回回回归归归归。而而而而根根根根据据据据回回回回归归归归方方方方程程程程式式式式的的的的特特特特征征征征,又又又又可可可可以以以以分分分分为为为为线线线线性性性性回回回回归归归归和和和和非非非非线线线线性性性性回回回回归归归归。一一一一元元元元线线线线性性性性回回回回归归归归分分分分析析析析是所有回归分析的基础,是所有回归分析的基础,是所有回归分析的基础,是所有回归分析的基础, 另另另另外外外外,回回回回归归归归分分分分析析析析与与与与相相相相关关关关分分分分析析析析具具具具有有有有密密

96、密密切切切切的的的的联联联联系系系系。一一一一般般般般说说说说来来来来,只只只只有有有有当当当当两两两两个个个个变变变变量量量量之之之之间间间间存存存存在在在在着着着着较较较较高高高高程程程程度度度度的的的的相相相相关关关关关关关关系系系系时时时时,回回回回归归归归分分分分析析析析才才才才变变变变得得得得有有有有意意意意义义义义和和和和有有有有价价价价值值值值。因因因因此此此此,往往往往往往往往先先先先进进进进行行行行相相相相关关关关分分分分析析析析,然然然然后后后后才才才才选选选选用用用用有有有有明显相关关系的变量作回归分析。明显相关关系的变量作回归分析。明显相关关系的变量作回归分析。明显相

97、关关系的变量作回归分析。7/27/202479 1. 1. 线性回归线性回归线性回归线性回归 线性回归分析,一般是先依据相关表做出线性回归分析,一般是先依据相关表做出线性回归分析,一般是先依据相关表做出线性回归分析,一般是先依据相关表做出散点图,直观地估计散点图,直观地估计散点图,直观地估计散点图,直观地估计X X和和和和Y Y关联性。如果两变量关联性。如果两变量关联性。如果两变量关联性。如果两变量的确呈现出一定的线性相关趋势,便可以设所的确呈现出一定的线性相关趋势,便可以设所的确呈现出一定的线性相关趋势,便可以设所的确呈现出一定的线性相关趋势,便可以设所要求的回归直线方程为要求的回归直线方程

98、为要求的回归直线方程为要求的回归直线方程为 是是因变量因变量因变量因变量Y Y的预测值或称估计值。的预测值或称估计值。的预测值或称估计值。的预测值或称估计值。 回归方程的建立:回归方程的建立:回归方程的建立:回归方程的建立: 先做散点图;先做散点图;先做散点图;先做散点图;利利利利用最小二乘法。用最小二乘法。用最小二乘法。用最小二乘法。7/27/202480 运用最小平方法可以在所有可能的直线中找到使运用最小平方法可以在所有可能的直线中找到使 Q达到最小的回归直线。达到最小的回归直线。 分别对分别对a、b求偏导并令其为零,求得两个标准方程:求偏导并令其为零,求得两个标准方程: 解联立方程,得到

99、解联立方程,得到 a 和和 b 的计算公式:的计算公式:XY7/27/202481 在回归方程中,在回归方程中,b b有十分重要的意有十分重要的意义,被称为回归系数。义,被称为回归系数。b b值的大小,值的大小,反映了反映了X X对对Y Y有多大的影响,即有多大的影响,即b b值就值就是当是当X X增加一个单位时增加一个单位时Y Y值的增量。值的增量。 7/27/202482 例:为了研究受教育年限和职业声望之间的关系,设例:为了研究受教育年限和职业声望之间的关系,设例:为了研究受教育年限和职业声望之间的关系,设例:为了研究受教育年限和职业声望之间的关系,设以下是以下是以下是以下是8 8名社会

100、成员抽样调查的结果,求直线回归方程。名社会成员抽样调查的结果,求直线回归方程。名社会成员抽样调查的结果,求直线回归方程。名社会成员抽样调查的结果,求直线回归方程。 解:解:解:解: 直线回归方程是直线回归方程是直线回归方程是直线回归方程是 7/27/202483调查调查调查调查对象对象对象对象年年年年x x声望声望声望声望y yxyxyx x2 21 1 12 12 70 70 840 840 144 1442 2 16 16 80 8012801280 256 2563 3 9 9 50 50 450 450 81 814 4 19 19 86 8616341634 361 3615 5 2

101、1 21 90 9018901890 441 4416 6 10 10 65 65 650 650 100 1007 7 5 5 44 44 220 220 25 258 8 12 12 75 75 900 900 144 144合计合计合计合计10410456056078647864155215527/27/202484XY总变差总变差 = 回归变差回归变差 + 剩余变差剩余变差2. 决定系数(决定系数(r2) 三种变差平方和三种变差平方和总变差总变差 SST回归变差回归变差 SSB剩余变差剩余变差 SSW7/27/202485 是是是是r r2 2而非而非而非而非r r 具有具有具有具有P

102、REPRE意义意义意义意义 决定系数也可以表达为回归变差在总决定系数也可以表达为回归变差在总决定系数也可以表达为回归变差在总决定系数也可以表达为回归变差在总变差中所占比例变差中所占比例变差中所占比例变差中所占比例 7/27/202486 相关指数相关指数相关指数相关指数R R,对于直线相关来说,等同于,对于直线相关来说,等同于,对于直线相关来说,等同于,对于直线相关来说,等同于r r, 即即即即R Rr r。但对于非线性相关来说,就只能用相关。但对于非线性相关来说,就只能用相关。但对于非线性相关来说,就只能用相关。但对于非线性相关来说,就只能用相关 指数指数指数指数R R来加以测量了。来加以测

103、量了。来加以测量了。来加以测量了。3.相关指数相关指数R7/27/202487总变差:不知回归方程时,总变差:不知回归方程时,总变差:不知回归方程时,总变差:不知回归方程时,剩余变差:剩余变差:剩余变差:剩余变差:Y Y值对于回归直线的偏差值对于回归直线的偏差值对于回归直线的偏差值对于回归直线的偏差, ,。回归变差:回归已知时误差减少的量。回归变差:回归已知时误差减少的量。回归变差:回归已知时误差减少的量。回归变差:回归已知时误差减少的量。 总变差总变差总变差总变差 = = 剩余变差剩余变差剩余变差剩余变差 + + 回归变差回归变差回归变差回归变差 总平方和总平方和总平方和总平方和 = = 未

104、解释的平方和未解释的平方和未解释的平方和未解释的平方和 + + 已解释的平方和已解释的平方和已解释的平方和已解释的平方和 SS SST T = SS= SSe e + SS+ SSA A r r 2 2= =(总变差(总变差(总变差(总变差 - - 剩余变差)剩余变差)剩余变差)剩余变差)/ /总变差总变差总变差总变差 = =回归变差回归变差回归变差回归变差/ /总变差总变差总变差总变差 是是是是r r2 2而非而非而非而非r r 具有具有具有具有PREPRE意义,所以意义,所以意义,所以意义,所以r0.3r0.3时判定无相关。时判定无相关。时判定无相关。时判定无相关。4.积差系数的积差系数的

105、PRE意义意义7/27/202488第六节第六节 曲线相关与回归曲线相关与回归n n 非线性相关和回归的一般课题太复杂,无法在非线性相关和回归的一般课题太复杂,无法在本书中充分地展开。幸运的是,一些非线性关系,本书中充分地展开。幸运的是,一些非线性关系,有可能通过适当的变量变换,将非线性函数转化为有可能通过适当的变量变换,将非线性函数转化为线性函数,从而把非线性相关和回归问题转化为线线性函数,从而把非线性相关和回归问题转化为线性相关和回归问题来处理。而且,这些比较简单的性相关和回归问题来处理。而且,这些比较简单的非线性方程对于社会研究中产生的许多非线性关系非线性方程对于社会研究中产生的许多非线

106、性关系来说,通常还是足以胜任的。来说,通常还是足以胜任的。 1. 1. 可线性化的非线性函数可线性化的非线性函数可线性化的非线性函数可线性化的非线性函数 2. 2. 二次曲线二次曲线二次曲线二次曲线 3. 3. 指数曲线指数曲线指数曲线指数曲线 7/27/202489估计标准误差估计标准误差估计标准误差估计标准误差 为了测定回归线的代表性,引入为了测定回归线的代表性,引入为了测定回归线的代表性,引入为了测定回归线的代表性,引入 用来反用来反用来反用来反映围绕回归线的映围绕回归线的映围绕回归线的映围绕回归线的Y Y值分布的离散程度。又称回归值分布的离散程度。又称回归值分布的离散程度。又称回归值分

107、布的离散程度。又称回归标准差。标准差。标准差。标准差。7/27/202490估计标准误差的解释估计标准误差的解释估计标准误差的解释估计标准误差的解释 (1 1)Y Y的实际观测值在对应的每个估计值的实际观测值在对应的每个估计值的实际观测值在对应的每个估计值的实际观测值在对应的每个估计值Y YP P周围呈正态分布,越靠近周围呈正态分布,越靠近周围呈正态分布,越靠近周围呈正态分布,越靠近Y YP P的地方的地方的地方的地方Y Y值出现的机值出现的机值出现的机值出现的机会越多。会越多。会越多。会越多。 (2 2)所有的正态分布都具有相同的标准差:)所有的正态分布都具有相同的标准差:)所有的正态分布都具有相同的标准差:)所有的正态分布都具有相同的标准差:同方差性。据此,可以对同方差性。据此,可以对同方差性。据此,可以对同方差性。据此,可以对Y Y进行估计和推断。进行估计和推断。进行估计和推断。进行估计和推断。7/27/202491 练习:以下是生活期望值与个人成就的练习:以下是生活期望值与个人成就的抽样调查。抽样调查。求:相关系数和回归直线。求:相关系数和回归直线。生活期望值生活期望值10108 87 76 64 43 32 21 1个人成就个人成就7 79 910104 42 21 13 32 27/27/202492

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号