文档详情

相关分析与回归分析

m****
实名认证
店铺
DOC
374.50KB
约15页
文档ID:448924462
相关分析与回归分析_第1页
1/15

相关分析和回归分析 一、相关分析(一)相关的概念 两个变量之间不精确、不稳定的变化关系称为相关关系两个变量之间的变化关系,既表现在变化方向上,又表现在密切程度上二)相关的种类1、从变化方向上划分正相关:一个变量增大,另一个变量对应值也随之增大;或另一个变 量值减小,另一个变量对应值也随之减小,两列变量变化方向相同负相关:一个变量增大,另一个变量对应值也随之减少;或一个变量 值减小,另一个变量对应值也随之增大,两列变量变化方向相反零相关:两变量值的变化方向无规律2、从变量相互关系的程度上划分无论两个变量的变化方向是否一致,凡密切程度高的称为强相关或高度相关;密切程度一般的称为中度相关;密切程度弱的称为弱相关或低度相关三)相关散布图它是表示两种事物之间的相关性及联系的模式以直角坐标的横轴表示x列变量,纵轴表示y列变量,在相关的两变量对应值的垂直相交处画点,构成相关散布图。

相关散布图的用途:图5-2(b) 直线相关图5-2(a) 曲线相关1、判断相关是否直线式图5-3b 低度相关图5-3(a) 高度相关2、判断相关密切程度高低 图5-4(a) 正相关3、判断相关变化方向图5-4(b) 负相关 (四)相关系数用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数一般用r表示注: (1)相关系数的数值范围是2)从r的正负以及绝对值的大小,可以表明两个变量之间变化的方向及密切程度—”号表示变化方向(“+”号表示变化方向一致,即正相关;“—”号表示变化方向相反,即负相关)r的绝对值表示两变量之间的密切程度(即强度)绝对值越接近1,表示两个变量之间关系越密切;越接近0,表示两个变量之间关系越不密切3)相关系数只能描述两个变量之间的变化方向及密切程度,并不能揭示两者之间的内在本质联系另外若两变量相关系数为0,只能表示两变量间没有线性关系,也可能存在曲线关系,即r=0,并不意味着两变量是独立的五)积差相关 1.积差相关的概念当两个变量都是正态连续变量,且两者之间呈线性关系时,表示这两个变量之间的相关称为积差相关。

2.积差相关的适用条件 (1)两变量均应由测量得到的连续性数据(量—量数据)2) 两个变量的总体都呈是正态分布,或接近正态的单峰对称 分布 3.积差相关系数的定义公式积差相关系数就是两个变量标准分数乘积之和除以n所得之商用公式可表示为:在此:表示X变量的样本标准差, 表示Y变量的样本标准差六)相关系数的显著性检验 1.:条件下,相关系数的显著性检验对于总体相关系数的零假设进行显著性检验时,又分为两种情况: (1)当的情况当时,r的抽样分布接近于正态分布,其检验的统计量为: 在此 r表示两个变量的积差相关系数 n表示样本的容量(2)当的情况当时,关于的零假设,可以用t统计量来检验相关系数的显著性 在此r表示两个变量的积差相关系数 n表示样本的容量例2.从高一学生中随机抽取26名学生,其数学与英语考试成绩的积差相关系数为0.65,试问从总体上讲,数学与英语考试成绩是否相关?解:(1)提出假设: (2)选择检验统计量并计算其值由于假设,样本相关系数的标准记分呈t分布,故选择t作为检验统计量,将r=0.65, n=26 代入公式,则(3)确定检验的形式:双侧检验 (4)统计决断根据df=n-2=26-2=24, 查t值表得,。

由于实际的根据统计决断规则,在0.01的显著性水平上拒绝原假设结论:从总体上看:高一学生数学与英语考试成绩呈正相关 2.:()条件下,相关系数的显著性检验检验步骤:(1)提出假设(2)查r与的转换表将r转换成,转换成 (3)选择检验统计量并计算其值由于的抽样分布呈正态分布,则检验统计量为 在这里表示的标准误,其中n代表样本容量 (4)、确定检验的形式(5)、统计决断例3,26名高一学生的数学与英语考试成绩的积差相关系数为0.65是否来自于相关系数等于0.5的总体?解:(1) 提出假设,(2) 进行r与的转换:查r与转换表得,与r=0.65相对应的=0.775,与相对应的3) 选择统计量并计算—由于的抽样分布呈正态分布,故选择Z作为统计量,将上述数据代入公式: (4) 统计决断:由于实际算出的|Z|=1.08<1.96= ,根据双侧Z检验统计决断规则,则P>0.05于是,只得保留原假设结论是:在0.05的显著性水平上可以认为,高一学生数学与英语考试成绩总体相关系数一致,来源于总体七)其他相关系数 1.等级相关系数等级相关是指以等级次序排列或以等级次序表示的变量之间的相关。

我们主要介绍斯皮尔曼等级相关1)斯皮尔曼等级相关的概念及适用条件两变量是等级测量数据,且总体不一定呈正态分布,样本容量也不一定大于30,这样两变量的相关,称为斯皮尔曼等级相关适用条件: ①两变量的资料为等级测量数据,且具有线性关系②对于粗略估计到的连续变量的测量数据,按其大小排成等级,亦可用等级相关计算③不要求总体呈正态分布2)相关系数的计算计算等级相关系数的公式为: 在这里 表示等级相关系数 D表示两个变量每对数据等级(不是指原始的等级)之差 n 表示样本的容量注:若出现相同的等级分数时,可用它们所占等级位置的平均数作为它们的等级如下例,X列中90分有两个,且所占等级位置分别为3、4,故取它们的平均值(3+4)/2=3.5例4,某校为了研究学生自学能力与学业成绩之间的关系,随机抽取10名学生的自学能力和学科成绩,见下表,求其相关系数序号X(能力)等级Y(成绩)等级D 1903.5884-10.25285780611370108064164857798-115903.5952.51168097010-117857759-2481001981009875806-1110922922.5-10.25 25.5解:即学生的自学能力与学习成绩的相关程度是0.852.点二列相关(质—量相关)(1)概念及适用条件两列变量一列是正态连续变量,另一列是二分变量,描述这两个变量之间的相关,称为点二列相关。

适用条件:一列是正态连续变量,另一列是二分变量(如男与女,对与错等)2)相关系数的计算 在此 p为二分变量中某一项所占比例 q为二分变量中另一项所占比例 为二分变量中比例为p部分所对应的连续变量的平均数 为二分变量中比例为q部分所对应的连续变量的平均数 为连续变量的标准差 另一种表示形式为: 在这里 表示连续变量中所有分数的平均数(八)相关分析小结一、如何判断两个变量的相关性——步骤 (1)找出两个变量的正确相应数据; (2)画出它们的散布图(散点图); (3)通过散布图判断它们的相关性; (4)给出相关系数的解答; (5)对结果进行评价和显著性检验二、知识结构一览表 相关类型相关系数水平显著性检验适用条件统计量检验类型备注量-量相关积差相关系数r=(n<50)T检验小样本(n>50)Z检验大样本,近似于正态分布:Z检验近似于正态分布质-质相关等级相关系数两类都是等级变量T检验非正态分布质-量相关点二列相关一列是正态变量,一列是二分变量采用积差相关系数的检验方法同上同上查表法——df=n-2,找到相关系数的临界值,将计算所得的值与临界值进行比较,若小于临界值,保留原假设,否则,拒绝。

T检验非正态分布二、回归分析相关表示两个变量之间的双向相互的关系如果我们将存在相关的两个变量,一个作为自变量,另一个作为因变量,并把两者之间不十分准确、稳定的关系,用数学方程式来表达,则可利用该方程由自变量的值来估计、预测因变量的估计值,这一过程称为回归分析可见,回归表示一个变量随另一个变量作不同程度变化的单向关系回归分析的目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量来预测研究者感兴趣的变量在教育研究中,不少变量之间存在一定的关系,但是由于关系比较复杂,而且受偶然因素影响较大,两者只是一种不十分确定的回归关系如果散点的分布有明确的直线趋势,我们就可以配制一条最能代表散点图上分布趋势的直线,这条最优拟合线即称为回归线确定回归线的方程称为回归方程一)一元线性回归方程的建立一元线性回归方程的通式为,式中a是回归线在Y轴上的截距;b是回归线的斜率,称为回归系数 如何求a、b? 方法一:用最小二乘法确定a、b :我们构造一元线性回归方程 ,用 来估计实际值y,要使这样估计获得最好的效果那么,a、b的值应该使 的值最小,由于用 计算,有正有负,总体上看 趋向于0 。

因此,在计算时,我们对其取平方值,用 ,求a、b,使得最小因此,构造一个新的函数,令求出Q(a,b)的最小值点——根据微积分求极值原理:(2)(1)将代入(2)中运用最小二乘法,确定回归方程:方法二:在r(相关系数)已知的情况下,可以代入以下公式: :Y的标准差 : X的标准差(二) 一元线性回归方程的检验用回归系数检验回归方程的显著性模型:首先,提出原假设和备择假设:其次,确定并计算统计量:最后,统计决断:查自由度为n-2的t值分布表,若,拒绝原假设,认为X对Y有显著影响 2、用积差相关系数检验回归方程的显著性采用统计量: (同积差相关系数显著性检验) 3、用方差分析检验回归方程的显著性回归平方和所占比重越大,误差平方和所占比重就越小,意味着变量间线性关系就越显著所以,回归方程的显著性,可以采用回归平方和的分析来进行总平方和=回归平方和+误差平方和方差分析检验的过程1.提出假设:2.采用统计量 :注:F= 3.查表并作统计推断:当F< ,接受 ,不存在显著关系; 当,在0.05水平上拒绝原假设;当 ,在0.01水平上拒绝。

下载提示
相似文档
正为您匹配相似的精品文档