相关测量和详析模式

上传人:tian****1990 文档编号:71605337 上传时间:2019-01-21 格式:PPT 页数:37 大小:222KB
返回 下载 相关 举报
相关测量和详析模式_第1页
第1页 / 共37页
相关测量和详析模式_第2页
第2页 / 共37页
相关测量和详析模式_第3页
第3页 / 共37页
相关测量和详析模式_第4页
第4页 / 共37页
相关测量和详析模式_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《相关测量和详析模式》由会员分享,可在线阅读,更多相关《相关测量和详析模式(37页珍藏版)》请在金锄头文库上搜索。

1、第九章 相关测量和详析模式,关键词:相关、相关关系、相关分析、Lambda系数()、Gamma系数(G)、 dy系数、尤拉Q系数、二维交互分类表、条件百分表、因果分析、阐明分析、条件分析,思考题: 何为相关关系?相关关系的种类有哪些? 相关分析的意义何在? 如何理解相关系数的概念和作用?掌握几种相关系数的计算方法。 什么是二维交互分类表?举例说明其分析方法和作用。 什么是条件百分表?为什么要编制条件百分表? 试比较因果分析、阐明分析和条件分析的联系和区别。,一、相关和相关系数,(一)相关关系 相关关系是指客观事物之间存在的一种相互关系。从统计上讲,所谓相关,是指一个变项的值与另一个变项的值有连

2、带性。即如果一个变项的值发生变化,另一个变项的值也有变化,则两个变项就是相关的。,1、相关关系的种类: (1)数量相关:以数量形式表现事物之间的依存关系。 品质相关:以类别、序列等非数量形式表现事物之间的依存关系。 (2)单相关:两变量相关 复相关:多变量相关 (3)直线相关:自变量与因变量的数量关系呈直线分布状态。 曲线相关:自变量与因变量的数量关系呈曲线分布状态。,(4)正相关:一个变量的值增加时,另一个变量的值也相应增加。 负相关:一个变量的值增加时,另一个变量的值也相应减少。 2、相关分析:对事物间相关关系进行的研究。 (1)判断事物之间有无相关关系; (2)确定其相关关系的密切程度;

3、 (3)通过计算相关系数来确定相关程度及方向。,(二)相关系数 相关系数是表明变量之间相关程度的数值,也称相关统计量。其数值的变化范围在-1与+1之间。 相关系数为正数时表示正相关,为负数时表示负相关; 相关系数为+1或-1时,表示完全正相关或完全负相关; 相关系数越接近于0,表示相关程度越低。,2、常见的相关系数 两个定类变量间的相关系数Lambda对称情况下,用表示,不对称情况下,用y表示。 两个定序变量间的相关系数Gamma,用G表示,用于对称情况下。如果是不对称关系,则要用萨默斯系数。 两个定距变量间的相关系数皮尔逊Pearson积矩相关系数,用r表示。r2称为决定系数,具有消减误差的

4、意义。,通常积矩相关系数r与简单线性回归方Y=bx+a结合使用,关系密切。r系数所要表示的,就是以线性回归方程式作为预测的工具时所能减少的误差比例。因此,如果r系数值愈大,就表示线性回归方程式的预测能力愈强。当然这是假设X与Y具有直线相关关系。,4. 定类变量与定距变量的相关比率eta平方系数,用E2表示。 公式为: 相关比率可以用于非线性相关的的测量。通过比较正值与r值,可以大致上知道是否存在线性关系:两值相差愈大,显示变量间的关系愈是非线性。,5. 定类变量与定序变量,很多社会学家仍采用Lambda系数,把定序变量当作定类变量来处理;定序变量与定距变量,很多社会学家仍采用相关比率eta平方

5、系数,亦把定序变量当作定类变量来处理。,二、几种主要的相关测量法,(一)Lambda相关测量法 从统计上讲(大量观察结果),在定类测量中,要预测一个定类变量的值,以众数作为预测的依据所犯的错误总是最小的;在定序测量中,以中位数估计定序变量的数值,所犯的错误总是最小的;在定距测量中,以平均数估计定距变量的资料,错误最小。,Lambda相关测量法,又称为格特曼的可预测度系数,其基本逻辑是计算以一个定类变量的值来预测另一个定类变量的值时,如果以众数作为预测的准则,可以减除多少误差。消减的误差在全部误差中所占的比例愈大,就表示这两个变量的相关愈强。 Lambda相关测量法有两种形式:一种是对称形式,即

6、两个变量的关系是对称的,不分自变量或依变量,用表示。另一种是不对称形式,即两个变量中一个是自变量(X),另一个依变量(Y)。公式分别为:,对称情况下 不对称情况下 式中,My为X变量的众数值 My为Y变量的众数值 mx为Y变量各个类别中X变量的众数值 mx为X变量各个类别中Y变量的众数值 n 为总次数,在不对称公式中,X为自变量,Y依变量,分母表示在不知道X值的情况下来预测Y的众数时所产生的全部误差,即E1=N-My分子表示根据X值来预测Y的众数所能消减的误差,其计算方法是: 所表示的就是消减误差的比例,其统计值介于0与1之间。,(二) Gamma和dy相关的测量法 Gamma系数和 dy系数

7、主要应用于两个定序变量的相关测量,前者适用于分析对称的关系,后者适用于不对称的关系。两系数的取值范围为-1至+1,数值的大小表明相关的程度,正负号表示相关的方向,同时具有消减误差比例的意义。,Gamma和 dy相关测量法统称为级序相关法,其基本逻辑是要求出根据任何两个个案在某变量上的等级来预测他们在另一个变量上的等级时,可以减少的误差是多少。 假设样本的全部个案数目是n,就会组成(1/2)n(n-1),如果某对个案在两个变量上的相对等级相同,则称为同序对,如果等级方向不相同,则称为异序对。,(二)二维交互分类表和尤拉Q系数 1、二维交互分类表 各有两个分类的两个变量(X与Y)进行交叉分类的频数

8、分配表就是二维交叉分类表,又称二维列联表或条件次数表。其基本表式如下:(表9-5),3、条件百分表 条件次数表的缺点,是难以比较不同条件下的次数分布,即在变量分类中作为基数的边缘次数各不相同,缺乏可比性。为此,必须将各个基数标准化。常用的方法是将基数都定为100,各个条件次数就随而变为百分率。这样制成的列联表,称为条件百分表。 根据表9-7家庭状况与青少年犯罪行资料编制条件百分表如表9-8,三、详析模式,详析模式是社会学研究中运用多变量分析方法研究解释两个变量之间相互关系的一种定量分析方法。根据其作用分为三种模式: 因果分析:X与Y是否真有因果关系? 阐明分析:为什么X会影响Y? 条件分析:在

9、不同情况下X与Y会有不同的 关系吗?,(一)因果分析 因果分析又称辨明模式,其做法是引进其它变量(即第三变量W),看是否是由于W既影响X,又影响Y,而使X与Y发生关系。如结婚年数X,发病率Y,其实是因为年龄W。 W X Y (图9-1),在因果分析中,第三变量(W)被称为前置变项,因为它在因果模型上的位置是先于X与Y的。因果分析的作用,是引进若干前置变项,用它们来辨明X与Y的因果关系是虚假的,还是真实的。,怎样辨明因果关系的虚实呢?基本思路是:假如我们能够控制W,使之不变,而X变化时Y也起变化,那就表示X与Y的关系不是由W引起的,也即X与Y的因果关系可能是真实的。这里只能说是“可能”真实,因为

10、除了W以外,可能还有其他前置变项会影响X与Y的关系。当然,所控制的前置变项越多,X与Y的因果关系就越真实。相反,如果控制W以后,即W不变,X与Y的关系消失,即X变时Y却不变,则X与Y的因果关系是虚假的。,怎样控制W呢?在社会学研究或社会调查研究中,通常用统计方法来控制变项。主要是通过分表的方法来实现对W的控制。所谓分表法,就是依据前置变项(W)的值,将样本个案分组,把原条件次数表分拆成若干分表,然后分析每个分表中X与Y的关系。由于每个分表中,每个个案的前置变项是相同的,在这种情况下分析X与Y的关系,就排除了W的影响。这时,研究结果有三种可能性:,X与Y的关系消失。说明原表中X与Y的因果关系是虚

11、假的,原关系是由W所导致的。 X与Y的关系维持原状。说明原表中X与Y的关系可能是真实的,W对X和Y没有影响。 X与Y的关系存在但弱化了。说明原表中X与Y的关系可能是真实的,其中部分是由W导致的。 例见教材P354表9-9消防员人数与火灾损失。,(二) 阐明分析 阐明分析又称因果环节分析,它所关注的问题是:为什么X会影响Y ?阐明分析的作用,就是要以事实来验证:X是通过某些因素(T)来影响Y的。图示如下: X Y T 图9-2 其中T是第三类变项,在阐明分析中称为介入变项。,阐明分析的基本思路是:假如我们能够控制T,使之不变,结果X变但Y不变,则T就显然是X与Y之间的关键环节,即证明X是通过T影

12、响Y的。相反,在控制T以后,X变而Y亦变,则证明T是无关要紧的,即X不是通过T而影响Y的。因果分析是要辨明X与Y因果关系的虚实,而阐明分析则是以事实证明因果之间的环节,但阐明分析的方法仍然是分表法,将各个分表的统计值与原表比较,可以分成三种情况: (1)完全阐明,即X完全通过T影响Y。 (2)不能阐明,即X完全不是通过T影响Y的。 (3)部分阐明,即X通过T部分地影响Y。,例1:见教材P360-363,青少年对父母的依附程度与 偏差行为。 例2:有人调查了300名35-40岁的妇女,发现教育水 平(X)越高,子女数目(Y)越少,计算出 的Gamma系数G=-0.70,这是为什么呢? 第一种解释

13、:教育水平越高的妇女越晚结婚,因而生的孩子就较少。因此引入“结婚年龄”作为介入变项(T),采用分表法求得,晚婚妇女中教育水平与子女数目的相关系数是G=-0.71,而早婚妇女中G=-0.68两者与原表G=-0.70很接近。这说明晚婚的说法,不能阐明教育水平与子女数目的反比关系。,第二种解释:教育水平越低的妇女,愈是重男轻女,结果会生较多的孩子。我们不妨控制“重男轻女”这个介入变项,结果发现在重男轻女的妇女中G=-0.45,在不重男轻女的妇女中G=-0.50。两个分表仍维持教育水平与子女数目的反比关系,不过在程度上要弱于原表的G=-0.70,这说明教育水平较低的妇女所生子女较多,部分是由于她们具有

14、重男轻女的观念。,第三种解释:教育水平越高的妇女,社会意识越强,所生孩子越少。社会意识(中介变项)分高、中、低三档,三档中教育水平与子女数目的相关系数分别为-0.18、-0.20和-0.23。显然,控制了社会意识变项以后,教育水平与子女数目仍有反比关系,但与原相关-0.70相比却是减弱了很多。因此,可以这样认为:教育水平较高的妇女所生孩子较少,在很大程度上是由于她们的社会意识较强。,(三)条件分析 条件分析也称表明模式,是指引入若干条件变项(C)以区分在不同条件下,X与Y的关系会不会不同的一种统计分析方法。 条件分析同样可用分表法:依据条件变项的值将样本分组,然后在每组中(即每种条件下)分析X与Y的关系。如果X与Y的关系在各组中大致相同,则表示X与Y的关系具有普遍性。相反,如果X与Y在不同的组(不同条件下)有不同的关系,就说明X与Y的关系具有条件性。,例见P364-368 青少年学习成绩与偏差行为, 人口密度与精神病率, 教育水平与社区参与。,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号