第10讲散点图、相关系数

上传人:今*** 文档编号:109932325 上传时间:2019-10-28 格式:PPT 页数:51 大小:1.27MB
返回 下载 相关 举报
第10讲散点图、相关系数_第1页
第1页 / 共51页
第10讲散点图、相关系数_第2页
第2页 / 共51页
第10讲散点图、相关系数_第3页
第3页 / 共51页
第10讲散点图、相关系数_第4页
第4页 / 共51页
第10讲散点图、相关系数_第5页
第5页 / 共51页
点击查看更多>>
资源描述

《第10讲散点图、相关系数》由会员分享,可在线阅读,更多相关《第10讲散点图、相关系数(51页珍藏版)》请在金锄头文库上搜索。

1、假设检验,假设检验就是事先对总体参数或总体分布形式做出一个假设,然后利用样本的实际资料来判断原假设是否合理的一种统计分析方法。 1.方差齐性原假设H0:认为两总体方差之间不存在显著性差异,方差齐性。 2.K-S检验或S-W检验原假设H0是数据服从指定的分布(如正态分布)。 3.卡方检验是以2分布为基础的一种假设检验方法,主要用于分类变量,根据样本数据推断总体的分布与期望分布是否有显著差异,或推断两个分类变量是否相关或相互独立。其原假设H0为:两个分类变量相互独立,1,上节回顾,均值比较 单样本T检验 AnalyzeCompare MeansOne Sample T Test 独立样本T检验 A

2、nalyze Compare MeansIndependentSamples T Test 配对样本T检验 Analyze Compare MeansPaired-Sample T Test,上节回顾,单样本T检验,概念 是检验样本均值与已知总体均值(检验值)之间是否存在差异。 统计的前提条件是:样本总体服从正态分布。 H0(单样本T检验的零假设):样本均值和总体均值之间不存在显著差异。(即两者差异不大,或没有差异) 检验结果的判断 (1)如果相伴概率值(P值或Sig.值)小于或等于用户假设的显著性水平0.05,则拒绝H0,认为样本均值和总体均值之间存在显著性差异。 (2)相反,相伴概率值(P

3、值或Sig.值)大于显著性水平0.05,则接受H0,认为样本均值和总体均值之间不存在显著性差异,上节回顾,独立样本T检验,概念 就是检验独立的正态总体下样本均值之间是否存在显著差异。 前提条件 检验前,要求进行比较的两个样本相互独立,并且服从正态分布,方差齐性。 独立样本T检验的H0假设:男女学生入学考试成绩(两个独立样本)之间不存在显著差异。 检验结果的判断 (1)如果相伴概率值(P值或Sig.值)小于或等于用户假设的显著性水平0.05,则拒绝H0,认为2个样本均值之间存在显著性差异。 (2)相反,相伴概率值(P值或Sig.值)大于显著性水平0.05,则接受H0,认为两个样本均值之间不存在显

4、著性差异,上节回顾,配对样本T检验,概念 就是根据样本数据对样本来自的两配对总体的均值是否有显著差异进行判断。 前提条件 (1)两样本必须是配对的,即配对要求两组同质受试样本配成对子或同一受试样本分别接受两种不同的处理; (2)样本来自的两个总体必须服从正态分布。 配对样本T检验的零假设为H0:配对样本的总体均值之间不存在显著差异。 解释: 如果相伴概率值小于或等于用户设想的显著性水平=0.05,则拒绝H0,认为两配对样本总体均值之间存在显著性差异。相反,相伴概率值大于显著性水平=0.05,则接受H0,认为两配对样本总体均值之间不存在显著性差异。,上节回顾,均值比较 T检验原假设:xxxx的均

5、值与yyyy的均值无显著差异,上节回顾,7,上节回顾,8,第10讲 散点图、相关系数,9,相关概念,10,一、相关的概念,变量之间关系的概念 客观世界中,事物之间存在相互依存、相互制约、相互影响的关系。用于描述事物数量特征的变量之间也存在一定的关系。 这些关系分为两种: (1)函数关系:变量之间的一一对应的关系,当自变量x取一定值时,因变量y依据函数关系取唯一的值。 如:在单价确定时,销售量与销售额之间的关系:y=f(x) 销售额价格 * 销售量 圆的面积与圆的半径之间的关系: 圆面积3.14 * 半径2,11,一、相关的概念,关系的概念 (2)相关关系:如果变量之间存在密切的关系,但又不能由

6、一个或几个变量的值确定另一个变量的值,当自变量x取一定值时,因变量y的值可能有多个,这种变量之间的非一一对应的、不确定的关系,称之为相关关系。 如:子女身高与父母身高之间的关系 证券指数与利率之间的关系,12,一、相关的概念,相关关系的分类 (1)按相关的程度分为: 完全相关:一个变量的取值完全取决于另一个变量,数据点落在一条直线(或曲线)上 相关:一个变量的取值部分取决于另一个变量,数据点围绕分布在一条直线(或曲线)上 不相关:两个变量的数据点分布很分散,无任何规律,13,一、相关的概念,相关关系的分类 (2)按相关的表现形式分为: 线性相关:两个变量之间的关系近似地表现为一条直线 非线性相

7、关:两个变量之间的关系近似地表现为一条曲线,14,一、相关的概念,相关关系的分类 (3)按相关的方向分为: 正相关:一个变量增加(减少),导致另一个变量增加(减少) 负相关:一个变量增加(减少),导致另一个变量减少(增加),15,一、相关的概念,线性相关的四种相关关系 强正线性相关: 一个变量x增加,导致另一个变量y明显增加,说明x是影响变量y的主要因素 弱正线性相关: 一个变量x增加,导致另一个变量y增加,但不明显,说明x是影响变量y的因素,但不是唯一的影响因素 强负线性相关: 一个变量x增加,导致另一个变量y明显减少,说明x是影响变量y的主要因素 弱负线性相关: 一个变量x增加,导致另一个

8、变量y减少,但不明显,说明x是影响变量y的因素,但不是唯一的影响因素,16,一、相关的概念,相关分析的概念 相关分析就是描述两个或两个以上变量间关系密切程度的统计方法,有效地揭示事物之间相关关系的强弱程度。 相关分析的方法 图形(散点图):常用的一种直观的分析方法,将样本数据点绘制在二维平面或三维空间上,根据这些数据点的分布特征,能够直观地研究变量间的统计关系以及它们的强弱程度和数据对的可能走向。 数值(相关系数):变量间关系的密切程度常以一个数量性指标描述,这个指标称相关系数,r=0.8,17,一、相关的概念,SPSS提供了三种相关分析的方法 二元变量分析( Bivariate ): 偏相关

9、分析( Partial ): 距离相关分析( Distances ):,18,相关分析的方法,19,二、相关分析的方法,散点图 散点图是相关分析过程中常用的一种直观的分析方法; 将样本数据点绘制在二维平面或三维空间上,根据数据点的分布特征,直观的研究变量之间的统计关系以及强弱程度。,就两个变量而言,如果变量之间的关系近似地表现为一条直线,则称为线性相关,如图(a)和(b); 如果变量之间的关系近似地表现为一条曲线,则称为非线性相关或曲线相关,如图(c); 如果两个变量的观测点很分散,无任何规律,则表示变量之间没有相关关系,如图(d) 。,20,二、相关分析的方法,相关系数 散点图能够直观地反映

10、变量之间的关系,但不精确。 相关系数以数值的方式精确地反映了变量之间线性关系的强弱程度。 相关系数通过正、负表示相关的方向,相关系数r的取值在-1+1之间: 下表中是通过相关系数来描述相关程度 不同类型的变量采用不同的相关系数指标,但取值范围和含义都是相同的,21,二、相关分析的方法,相关系数的分类 Pearson简单相关系数(皮尔逊) 用来度量正态分布的定距变量间的线性相关关系 Pearson简单相关系数要求变量来自的总体 分布正态 Spearman秩相关系数(斯皮尔曼) 采用非参数检验方法来度量定序变量间的线性相关关系 不要求总体正态分布 由于数据为非定距变量,因此不能直接采用原始数据,而

11、是利用数据的秩 Kendall秩相关系数(肯德和谐系数、一致性系数) 采用非参数检验方法来度量定序变量间的线性相关关系 多用于计算评价者的评定一致性,看备注页,变量的值之间可以比较大小, 两个值的差有实际意义,这样 的变量叫定距变量。在调查被 访者的“年龄”和“每月平均收入”, 都是定距变量。,定序变量 区别同一类别个案中等级次序的变量。定序变量能决定次序,也即变量的值能把研究对象排列高低或大小,具有与的数学特质。例如文化程度可以分为大学、高中、初中、小学、文盲,22,二、相关分析的方法,利用相关系数进行变量之间线性关系的分析 利用相关系数进行变量之间线性关系的分析分两步: (1)利用样本数据

12、计算样本相关系数r; (2)对样本的总体是否存在显著的线性关系进行推测。 注:显著的相关性并不能导出任何因果结论。,23,二、相关分析的方法,对样本的线性关系进行推测步骤 由于存在抽样的随机性以及样本数量较少等原因,通常样本相关系数不能直 接反映样本是否存在显著的线性相关关系,需要通过假设检验的方式对样本的总 体进行统计推测。 推测步骤 (1)提出零假设H0:两总体线性不相关(或相关系数与0无显著性差异) (2)选择检验统计量:对不同变量采用不同的相关系数,同时也采用不同的检验统计量 (3)计算统计量的观测值和对应的概率p值; (4)对总体的相关性进行推断,24,二、相关分析的方法,根据概率P

13、进行解释 检验统计量的概率p值小于等于给定的显著性水平值(0.05),拒绝零假设,认为总体相关。 若检验统计量的概率p值大于给定的显著性水平值(0.05),接受零假设,认为总体不相关。,25,二元变量分析,26,三、二元变量分析,概念 二元变量分析(Bivariate)是研究和分析两个变量之间相关程度的统计方法。 应用 很多时候都是通过两个变量进行相关分析,所以两个变量之间相关程度的分析应用十分广泛。 如:家庭收入与家庭消费支出之间关系是否相关 商品销售价格与商品销售额之间关系是否相关 客户满意度与商业企业综合竞争力之间关系是否相关 广告投入和销售额之间关系是否相关,27,三、二元变量分析,S

14、PSS操作及案例分析 例一:为了研究某项职业技能和员工年龄之间的 关系,对员工进行职业技能测试,得到有关上述两变量 的数据表。 现以年龄作为自变量x,职业技能测试得分为 因变量y,以两变量数据为依据,绘制散点图分析两变量 之间的相关关系。 注意:通过散点图只是初步分析两变量之间的相关关系 通常用散点图描述相关关系的表达方式: 完全相关 较强(正/负)相关 较弱(正/负)相关 不相关,28,三、二元变量分析,SPSS操作及案例分析 结果分析: 从散点图中可以看出,点的分布比较分散,在拟合线上或周围的点分布较少,说明两变量之间相关程度较弱。 从拟合线的趋势来看,职业技能和员工年龄之间之间有一定的相

15、关关系,而且是随着年龄的增加,职业技能测试得分会随之上升,但上升幅度较小。 所以上述两变量之间具有较弱正相关的关系。 通过对散点图的编辑,可以添加拟合线,29,三、二元变量分析,SPSS操作及案例分析 操作步骤 Graphs Legacy Dialogs Scatter/Dot 数据文件:8-Bivariate_age.sav 保存文件: 8-Bivariate_age.spv,常用的散点图类型 简单散点图 重叠散点图 矩阵散点图 三维散点图 单点散点图,30,三、二元变量分析,SPSS操作及案例分析 散点图的其他应用 (1)在散点图中设置散点标记。,31,三、二元变量分析,SPSS操作及案例

16、分析 散点图的其他应用 (2)在散点图中设置散点标签。,SPSS操作及案例分析 散点图的其他应用 (3)在散点图中添加拟合线。,32,三、二元变量分析,1.双击该图区,SPSS操作及案例分析 散点图的其他应用 (4)计算相关系数。 AnalyzeCorrelateBivariate.,33,三、二元变量分析,解释: 1.Sig.=0.0410.05,拒绝H0假设,表明两变量之间是相关的。 2.由于r=0.2290.3,为微弱正相关。,34,三、二元变量分析,SPSS操作及案例分析 例二:在有氧训练中,人的耗氧量y(毫升/分*千克体重)是衡量人的身体状况的重要指标,它与多项指标有关。为了研究人的耗氧量与多项指标之间的关系,对31名测试者进行测试。 现以人的耗氧量y为因变量,多项指标中之一1.5英里跑所用时间x3为自变量,通过散点图和相关系数,分析研究耗氧量y与1.5英里跑所用时间x3之间的相关关系。,35,三、二元变量分析,SPSS操作及案例分析 结果分析:

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号