取值范围-社会统计学课件

上传人:des****85 文档编号:324065285 上传时间:2022-07-12 格式:PPT 页数:92 大小:994KB
返回 下载 相关 举报
取值范围-社会统计学课件_第1页
第1页 / 共92页
取值范围-社会统计学课件_第2页
第2页 / 共92页
取值范围-社会统计学课件_第3页
第3页 / 共92页
取值范围-社会统计学课件_第4页
第4页 / 共92页
取值范围-社会统计学课件_第5页
第5页 / 共92页
点击查看更多>>
资源描述

《取值范围-社会统计学课件》由会员分享,可在线阅读,更多相关《取值范围-社会统计学课件(92页珍藏版)》请在金锄头文库上搜索。

1、第十二章第十二章 相关与回归分析相关与回归分析n n第一节第一节 相关关系及种类相关关系及种类n n第二节第二节 定类变量的相关分析定类变量的相关分析n n第三节第三节 定序变量的相关分析定序变量的相关分析n n第四节第四节 定距变量的相关分析定距变量的相关分析n n第五节第五节 回归分析回归分析 社会上,许多现象之间也都有相互联系,例如:社会上,许多现象之间也都有相互联系,例如:社会上,许多现象之间也都有相互联系,例如:社会上,许多现象之间也都有相互联系,例如:身高与体重、教育程度和收入、学业成就和家庭环境、身高与体重、教育程度和收入、学业成就和家庭环境、身高与体重、教育程度和收入、学业成就

2、和家庭环境、身高与体重、教育程度和收入、学业成就和家庭环境、智商与父母智力等。在这些有关系的现象中,它们之智商与父母智力等。在这些有关系的现象中,它们之智商与父母智力等。在这些有关系的现象中,它们之智商与父母智力等。在这些有关系的现象中,它们之间联系的程度和性质也各不相同。间联系的程度和性质也各不相同。间联系的程度和性质也各不相同。间联系的程度和性质也各不相同。本书第十章提出了两总体的检验及估计的问题,这本书第十章提出了两总体的检验及估计的问题,这本书第十章提出了两总体的检验及估计的问题,这本书第十章提出了两总体的检验及估计的问题,这意味着我们开始与双变量统计方法打交道了。双变量意味着我们开始

3、与双变量统计方法打交道了。双变量意味着我们开始与双变量统计方法打交道了。双变量意味着我们开始与双变量统计方法打交道了。双变量统计与单变量统计最大的不同之处是,客观事物间的统计与单变量统计最大的不同之处是,客观事物间的统计与单变量统计最大的不同之处是,客观事物间的统计与单变量统计最大的不同之处是,客观事物间的关联性开始披露出来。这一章我们将把相关关系的讨关联性开始披露出来。这一章我们将把相关关系的讨关联性开始披露出来。这一章我们将把相关关系的讨关联性开始披露出来。这一章我们将把相关关系的讨论深入下去,不仅要对相关关系的存在给出判断,更论深入下去,不仅要对相关关系的存在给出判断,更论深入下去,不仅

4、要对相关关系的存在给出判断,更论深入下去,不仅要对相关关系的存在给出判断,更要对相关关系的强度给出测量,同时要披露两变量间要对相关关系的强度给出测量,同时要披露两变量间要对相关关系的强度给出测量,同时要披露两变量间要对相关关系的强度给出测量,同时要披露两变量间的因果联系,其内容分为相关分析和回归分析这两个的因果联系,其内容分为相关分析和回归分析这两个的因果联系,其内容分为相关分析和回归分析这两个的因果联系,其内容分为相关分析和回归分析这两个大的方面。大的方面。大的方面。大的方面。第一节第一节 变量之间的相互关系变量之间的相互关系 1.1.相关程度相关程度相关程度相关程度 完全相关,指变量之间为

5、函数关系;完全不相关指变完全相关,指变量之间为函数关系;完全不相关指变完全相关,指变量之间为函数关系;完全不相关指变完全相关,指变量之间为函数关系;完全不相关指变量之间不存在任何依存关系,彼此独立。不完全相关介于量之间不存在任何依存关系,彼此独立。不完全相关介于量之间不存在任何依存关系,彼此独立。不完全相关介于量之间不存在任何依存关系,彼此独立。不完全相关介于两者之间。不完全相关是本章讨论的重点。两者之间。不完全相关是本章讨论的重点。两者之间。不完全相关是本章讨论的重点。两者之间。不完全相关是本章讨论的重点。由于数学手段上的局限性,统计学探讨的最多的是定由于数学手段上的局限性,统计学探讨的最多

6、的是定距距定距变量间能近似地表现为一条直线的线性相关。在定距变量间能近似地表现为一条直线的线性相关。在统计中,对于线性相关,采用相关系数(记作统计中,对于线性相关,采用相关系数(记作r r)这一指标)这一指标来量度相关关系程度或强度。就线性相关来说,当来量度相关关系程度或强度。就线性相关来说,当r r l l时,表示为完全相关;当时,表示为完全相关;当r r=0=0时,表现为无相关或零相时,表现为无相关或零相关;当关;当0 0 r r 1 1时,表现为不完全相关。时,表现为不完全相关。2.2.相关方向:正相关和负相关相关方向:正相关和负相关相关方向:正相关和负相关相关方向:正相关和负相关 所谓

7、正相关关系是指一个变量的值增加时,另一变所谓正相关关系是指一个变量的值增加时,另一变所谓正相关关系是指一个变量的值增加时,另一变所谓正相关关系是指一个变量的值增加时,另一变量的值也增加。例如,受教育水平越高找到高薪水工作的量的值也增加。例如,受教育水平越高找到高薪水工作的量的值也增加。例如,受教育水平越高找到高薪水工作的量的值也增加。例如,受教育水平越高找到高薪水工作的机会也越大。而负相关关系是指一个变量的值增加时,另机会也越大。而负相关关系是指一个变量的值增加时,另机会也越大。而负相关关系是指一个变量的值增加时,另机会也越大。而负相关关系是指一个变量的值增加时,另一变量的值却减少。例如,受教

8、育水平越高,理想子女数一变量的值却减少。例如,受教育水平越高,理想子女数一变量的值却减少。例如,受教育水平越高,理想子女数一变量的值却减少。例如,受教育水平越高,理想子女数目越少。要强调的是,只有定序以上测量层次的变量才分目越少。要强调的是,只有定序以上测量层次的变量才分目越少。要强调的是,只有定序以上测量层次的变量才分目越少。要强调的是,只有定序以上测量层次的变量才分析相关方向,因为只有这些变量的值有高低或多少之分。析相关方向,因为只有这些变量的值有高低或多少之分。析相关方向,因为只有这些变量的值有高低或多少之分。析相关方向,因为只有这些变量的值有高低或多少之分。至于定类变量,由于变量的值并

9、无大小、高低之分,故定至于定类变量,由于变量的值并无大小、高低之分,故定至于定类变量,由于变量的值并无大小、高低之分,故定至于定类变量,由于变量的值并无大小、高低之分,故定类变量与其他变量相关时就没有正负方向了。类变量与其他变量相关时就没有正负方向了。类变量与其他变量相关时就没有正负方向了。类变量与其他变量相关时就没有正负方向了。3.3.因果关系与对称关系因果关系与对称关系因果关系与对称关系因果关系与对称关系 因果关系中两个变量有自变量因果关系中两个变量有自变量因果关系中两个变量有自变量因果关系中两个变量有自变量(independent independent Variable)Variabl

10、e)和因变量和因变量和因变量和因变量(dependent Variable)(dependent Variable)之分:之分:之分:之分:(1 1)两个变量有共变关系;)两个变量有共变关系;)两个变量有共变关系;)两个变量有共变关系;(2 2)因变量的变化是由自变量的变化引起的;)因变量的变化是由自变量的变化引起的;)因变量的变化是由自变量的变化引起的;)因变量的变化是由自变量的变化引起的;(3 3)两个变量的产生和变化有明确的时间顺序,前者)两个变量的产生和变化有明确的时间顺序,前者)两个变量的产生和变化有明确的时间顺序,前者)两个变量的产生和变化有明确的时间顺序,前者称为自变量,后者称为

11、因变量。称为自变量,后者称为因变量。称为自变量,后者称为因变量。称为自变量,后者称为因变量。表现为对称关系的相关关系,互为根据,不能区分自表现为对称关系的相关关系,互为根据,不能区分自表现为对称关系的相关关系,互为根据,不能区分自表现为对称关系的相关关系,互为根据,不能区分自变量和因变量,或者说自变量和因变量可以根据研究目的变量和因变量,或者说自变量和因变量可以根据研究目的变量和因变量,或者说自变量和因变量可以根据研究目的变量和因变量,或者说自变量和因变量可以根据研究目的任意选定,例如身高和体重之间的关系。任意选定,例如身高和体重之间的关系。任意选定,例如身高和体重之间的关系。任意选定,例如身

12、高和体重之间的关系。4.4.单相关和复相关单相关和复相关单相关和复相关单相关和复相关 从变量的多少上看,单相关只涉及两个变量,亦称二元从变量的多少上看,单相关只涉及两个变量,亦称二元从变量的多少上看,单相关只涉及两个变量,亦称二元从变量的多少上看,单相关只涉及两个变量,亦称二元相关;三个或三个以上变量之间的关系称为复相关,亦称多相关;三个或三个以上变量之间的关系称为复相关,亦称多相关;三个或三个以上变量之间的关系称为复相关,亦称多相关;三个或三个以上变量之间的关系称为复相关,亦称多元相关。元相关。元相关。元相关。5.5.直线相关和曲线相关直线相关和曲线相关直线相关和曲线相关直线相关和曲线相关

13、从变量变化的形式上看,如果关系近似地表现为一条直从变量变化的形式上看,如果关系近似地表现为一条直从变量变化的形式上看,如果关系近似地表现为一条直从变量变化的形式上看,如果关系近似地表现为一条直线,称为直线相关或线性相关;如果关系近似地表现为一条线,称为直线相关或线性相关;如果关系近似地表现为一条线,称为直线相关或线性相关;如果关系近似地表现为一条线,称为直线相关或线性相关;如果关系近似地表现为一条曲线,则称为曲线相关或称为非线性相关。曲线,则称为曲线相关或称为非线性相关。曲线,则称为曲线相关或称为非线性相关。曲线,则称为曲线相关或称为非线性相关。由于数学手段的局限性,我们以学习线性相关为主。在

14、由于数学手段的局限性,我们以学习线性相关为主。在由于数学手段的局限性,我们以学习线性相关为主。在由于数学手段的局限性,我们以学习线性相关为主。在统计学中,通过分段处理线性相关也可以用于处理曲线相统计学中,通过分段处理线性相关也可以用于处理曲线相统计学中,通过分段处理线性相关也可以用于处理曲线相统计学中,通过分段处理线性相关也可以用于处理曲线相关。关。关。关。第二节第二节 定类变量的相关分析定类变量的相关分析本节内容:本节内容:1.列联表列联表 2.消减误差比例消减误差比例 3.系数系数 4.系数系数1.1.列联表列联表列联表列联表 列联表,是按品质标志把两个变量的频数分布进列联表,是按品质标志

15、把两个变量的频数分布进列联表,是按品质标志把两个变量的频数分布进列联表,是按品质标志把两个变量的频数分布进行交互分类,由于表内的每一个频数都需同时满足两个行交互分类,由于表内的每一个频数都需同时满足两个行交互分类,由于表内的每一个频数都需同时满足两个行交互分类,由于表内的每一个频数都需同时满足两个变量的要求,所以列联表又称条件频数表。变量的要求,所以列联表又称条件频数表。变量的要求,所以列联表又称条件频数表。变量的要求,所以列联表又称条件频数表。例如,某区调查了例如,某区调查了例如,某区调查了例如,某区调查了357357名选民,考察受教育程度与投名选民,考察受教育程度与投名选民,考察受教育程度

16、与投名选民,考察受教育程度与投票行为之间的关系,将所得资料作成下表,便是一种关票行为之间的关系,将所得资料作成下表,便是一种关票行为之间的关系,将所得资料作成下表,便是一种关票行为之间的关系,将所得资料作成下表,便是一种关于频数的列联表。于频数的列联表。于频数的列联表。于频数的列联表。22频数分布列联表的一般形式频数分布列联表的一般形式n n习惯上把因变量习惯上把因变量习惯上把因变量习惯上把因变量Y Y放在表侧,把自变量放在表侧,把自变量放在表侧,把自变量放在表侧,把自变量X X放在表头。放在表头。放在表头。放在表头。n n2222列联表是最简单的交互分类表。列联表是最简单的交互分类表。列联表是最简单的交互分类表。列联表是最简单的交互分类表。n nrcrc列联表列联表列联表列联表 r(row)r(row)、c(column)c(column)rc频数分布列联表的一般形式频数分布列联表的一般形式100100141454543232总数总数总数总数10104 44 42 2增广见闻增广见闻增广见闻增广见闻50507 741412 2理想工作理想工作理想工作理想工作40403 39 9282

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号