常用统计参数PPT精品文档

上传人:hs****ma 文档编号:584678478 上传时间:2024-08-31 格式:PPT 页数:134 大小:635KB
返回 下载 相关 举报
常用统计参数PPT精品文档_第1页
第1页 / 共134页
常用统计参数PPT精品文档_第2页
第2页 / 共134页
常用统计参数PPT精品文档_第3页
第3页 / 共134页
常用统计参数PPT精品文档_第4页
第4页 / 共134页
常用统计参数PPT精品文档_第5页
第5页 / 共134页
点击查看更多>>
资源描述

《常用统计参数PPT精品文档》由会员分享,可在线阅读,更多相关《常用统计参数PPT精品文档(134页珍藏版)》请在金锄头文库上搜索。

1、第二章:常用统计参数第二章:常用统计参数主讲:任杰主讲:任杰1统计量统计量n统计量统计量:反映一组数据(反映一组数据(样本样本)统计特)统计特征的数字。征的数字。 n参数参数:反映反映总体总体的统计特征的数字叫参的统计特征的数字叫参数。数。n统计量和参数的统计量和参数的统计意义统计意义是相同的,是相同的,计计算原理和方法算原理和方法也是相同的,只是在指代也是相同的,只是在指代不同对象时叫法不同,表示方法不同。不同对象时叫法不同,表示方法不同。2024/8/3122024/8/313一、集中量数一、集中量数n集中量集中量:即表现一组数据的集中趋势或即表现一组数据的集中趋势或集中程度,代表一组数据

2、的集中程度,代表一组数据的中心位置中心位置的的统计量。统计量。2024/8/314集中量集中量算算术术平平均均数数加权平均数加权平均数中中数数众众数数几几何何平平均均数数2024/8/315(一)算术平均数(一)算术平均数1、算术平均数、算术平均数:一般简称为平均数或均数一般简称为平均数或均数(Mean),一组数据的总和除以数据的),一组数据的总和除以数据的总个数所得的商就是算术平均数。总个数所得的商就是算术平均数。n学算术平均数常用代表变量的字母上加学算术平均数常用代表变量的字母上加一一“”来表示,如来表示,如2024/8/3162、算术平均数的计算、算术平均数的计算假设一变量假设一变量X共

3、有共有n个观测值,则变量个观测值,则变量X的的平均数为:平均数为:2024/8/3173、算术平均数的性质、算术平均数的性质n在一组数据中每个观测值与平均数之差在一组数据中每个观测值与平均数之差(离均差)的总和等于(离均差)的总和等于0。n在一组数据中,每一个观测值都加上一在一组数据中,每一个观测值都加上一个常数个常数C C,则所得平均数为原来的平均,则所得平均数为原来的平均数加上常数数加上常数C C。n在一组数据中,每一个观测值都乘以一在一组数据中,每一个观测值都乘以一个常数个常数C C,则所得平均数为原来的平均,则所得平均数为原来的平均数乘以常数数乘以常数C C。 2024/8/318证明

4、证明2024/8/3194、次数分布表算术平均数的计算次数分布表算术平均数的计算2024/8/31105、算术平均数的意义与优点、算术平均数的意义与优点n算算术术平平均均数数是是应应用用最最普普遍遍的的一一种种集集中中量量数,是数,是“真值真值”的的渐近、最佳估计值渐近、最佳估计值。n反反应应灵灵敏敏。观观测测数数据据中中任任何何一一个个数数值值的的变化都能通过算术平均数反应出来。变化都能通过算术平均数反应出来。n确确定定严严密密。只只要要是是同同一一组组数数据据,计计算算出出来来的的算算术术平平均均数数不不受受计计算算者者、时时间间、地地点等因素的影响。点等因素的影响。2024/8/3111

5、2024/8/31第二章:常用统计参数125、算术平均数的意义与优点、算术平均数的意义与优点n简简明明易易解解。原原理理简简单单易易懂懂,计计算算简简便便易易行。行。n符合代数方法进一步演算符合代数方法进一步演算。n较较少少受受抽抽样样变变动动的的影影响响。从从同同一一个个总总体体中中随随机机抽抽取取的的容容量量相相同同的的样样本本,所所计计算算出出的的算算术术平平均均数数与与其其他他集集中中量量指指标标相相比比,抽样误差较小。抽样误差较小。126、算术平均数应用的局限、算术平均数应用的局限n易受易受极端数据极端数据的影响。的影响。n若若有有模模糊糊不不清清的的数数据据,则则无无法法计计算算平

6、平均均数。数。n凡凡不不同同质质的的数数据据不不能能计计算算平平均均数数。(同同质质数数据据是是指指用用同同一一个个观观测测手手段段,采采用用相相同同的的观观测测标标准准,能能反反映映某某一一问问题题的的同同一一方面特质的数据。)方面特质的数据。) 2024/8/3113(二)中数(二)中数1、中中数数,又又叫叫中中位位数数,符符号号为为Md或或Mdn(Median),指指的的是是位位于于一一组组数数据据中中较较大大一一半半与与较较小小一一半半中中间间位位置置的的那那个数。个数。n中中数数可可能能是是观观测测数数据据中中的的某某一一个个,也也可可能根本不是原有的数。能根本不是原有的数。2024

7、/8/31142、未分组数据中数的计算、未分组数据中数的计算A、将数据依值的大小排序将数据依值的大小排序B B、如如果果位位于于数数据据序序列列中中间间的的几几个个数数不不重重复复,按以下方法计算,按以下方法计算中数中数:1 1)当当数数据据的的个个数数为为奇奇数数时时,取取位位于于中中间间的那个数即第(的那个数即第(N+1)/2个数为中数;个数为中数;2 2)当当数数据据的的个个数数为为偶偶数数时时,取取第第N/2个个和和第第N/2+1个数个数的平均数为中数。的平均数为中数。 2024/8/3115C C、如果位于数据序列中间的是几个、如果位于数据序列中间的是几个重复数据重复数据,则按以下方

8、法计算中数:则按以下方法计算中数:1 1)把重复数据视作某一区间上的几个连续的数;)把重复数据视作某一区间上的几个连续的数;2 2)根据)根据B B步骤的计算方法,中数落在哪一个数步骤的计算方法,中数落在哪一个数上,则该数的中点就是此一列数据的中数;上,则该数的中点就是此一列数据的中数;3 3)如果中数落在两个重复数据之间,则前一个)如果中数落在两个重复数据之间,则前一个重复数据的精确上限或后一个数据的精确下重复数据的精确上限或后一个数据的精确下限即为要求的中数。限即为要求的中数。2024/8/3116n2、4、5、7、8、9、9、11、13n2、4、5、5、7、8、9、9、11、13n2、4

9、、5、5、8、9、9、9、11、1212、13n2、4、5、5、8、9、9、9、11、1212、13、172024/8/31173 3、次数分布表中数的计算次数分布表中数的计算A、求求N/2,找找出出N/2即即中中数数所所在在的的分分组组区区间;间;B、求求N/2所所在在区区间间以以下下各各区区间间的的次次数数和和(即即中中数数所所在在组组区区间间下下限限以以下下的的累累加加次次数),记作数),记作Fb b;C、计算、计算N/2FbFb的值;的值;D D、求位于、求位于N/2N/2点的值点的值2024/8/31182024/8/3119其中:其中:nL Lmdmd为为N/2N/2所在区间的精确

10、下限所在区间的精确下限ni i为组距为组距nf fmd md 为中数所在区间的次数为中数所在区间的次数 2024/8/3120组别组别组中值组中值(Xc)次数次数(f)相对次数相对次数上限以下累上限以下累积百分数积百分数42.5-4510.0333.347.5-5030.10013.352.5-5530.10023.357.5-6030.10033.362.5-6540.13346.667.5-7040.13359.972.5-7580.26786.677.5-8030.10096.682.5-8510.034100.0总和总和()N=301.0002024/8/31214、中数的意义与应用、

11、中数的意义与应用n优点优点:计算简单,容易理解。计算简单,容易理解。n不不足足:反反应应不不够够灵灵敏敏;受受抽抽样样的的影影响响较较大大,不不稳稳定定;也也不不能能作作进进一一步步的的代代数数运运算。算。2024/8/31224、中数意义与应用、中数意义与应用n应应用用:中中数数一一般般不不经经常常使使用用,但但在在下下列列情情况况下,中数可以较好地反映数据的集中趋势:下,中数可以较好地反映数据的集中趋势:A A当一组观测结果中出现两极端数据时;当一组观测结果中出现两极端数据时;B B当当次次数数分分布布的的两两端端数数据据或或个个别别数数据据不不清清楚楚时时,只只能取中数作为集中趋势的代表

12、值;能取中数作为集中趋势的代表值;C C当当需需要要快快速速估估计计一一组组数数据据的的代代表表值值时时,也也常常用用中中数。数。2024/8/3123(三)众数(三)众数1、众众数数:又又叫叫范范数数,密密集集数数,通通常常数数等等,常常用用符符号号Mo o表表示示,是是指指一一组组数数据据中中出出现次数最多的那个数(现次数最多的那个数(Modeode)。)。2024/8/31242、众数的计算、众数的计算n求众数最简单的方法是通过直接观察找求众数最简单的方法是通过直接观察找出出粗略众数粗略众数。 n也可以用公式求出理论众数,也可以用公式求出理论众数,皮尔逊经皮尔逊经验法验法是常用的计算正态

13、分布数据理论众是常用的计算正态分布数据理论众数的方法,其公式为:数的方法,其公式为:Mo=3Md-2M2024/8/31253、众数的应用、众数的应用众数的众数的缺点缺点同中数一样,其应用也因此受同中数一样,其应用也因此受到限制,通常是在无法计算平均数的情到限制,通常是在无法计算平均数的情况下,用以了解一组数据的集中情况,况下,用以了解一组数据的集中情况,如存在极端数据、有模糊数据、有不同如存在极端数据、有模糊数据、有不同质数据等。质数据等。2024/8/3126(四)加权平均数(四)加权平均数1、加加权权平平均均数数是是用用来来表表示示不不同同比比重重数数据据、或或平均数平均数的平均数,用的

14、平均数,用 或或Mw表示。表示。n当当数数据据的的比比重重不不同同时时,如如果果直直接接用用算算术术平平均均数数来来表表示示该该组组数数据据的的集集中中趋趋势势,就就不不够够科科学学和和准准确确,这这时时就就要要用用权权数数(weightweight),即即该该数数据据在在整整个个数数据据总总体体中的相对重要性来计算平均数。中的相对重要性来计算平均数。 2024/8/31272、加权平均数的计算、加权平均数的计算2024/8/31283、加权平均数的应用、加权平均数的应用大学课程成绩的计算大学课程成绩的计算大学生综合测评成绩的计算大学生综合测评成绩的计算不同分实验不同分实验(调查调查)结果的会

15、合结果的会合等等等等2024/8/3129(五)几何平均数(五)几何平均数1 1、几几何何平平均均数数(geometric geometric meanmean):又又叫叫对数平均数对数平均数,符号记作,符号记作MgMg或或 。 2024/8/31302 2、几何平均数的应用条件、几何平均数的应用条件n一一组组实实验验数数据据中中有有少少数数数数据据偏偏大大或或者者偏偏小,数据的分布呈小,数据的分布呈偏态偏态时;时;n心心理理物物理理学学实实验验中中,用用等等距距和和等等比比量量表表测量所获得的数据;测量所获得的数据;n一一组组数数据据彼彼此此间间差差异异较较大大,几几乎乎是是按按一一定定的的

16、比比例例关关系系变变化化时时,如如教教育育研研究究中中教教育经费的增加、学校每年的招生人数等。育经费的增加、学校每年的招生人数等。2024/8/31313、几何平均数的计算、几何平均数的计算2024/8/3132n上式中,上式中,n代表数据的个数;代表数据的个数;n几何平均数有两种情况:一种是实验几何平均数有两种情况:一种是实验直直接观测值的平均数接观测值的平均数(如心理物理实验中(如心理物理实验中所获得的数据,此时用公式所获得的数据,此时用公式A,A,P36P36);一种是指数据的平均一种是指数据的平均变化率变化率(如人口的(如人口的增长率、学习能力的进步率等,此时用增长率、学习能力的进步率

17、等,此时用公式公式B B)。2024/8/3133练习练习一研究阅读能力随阅读遍数变化的实验结果如下:一研究阅读能力随阅读遍数变化的实验结果如下:第一遍,理解成分为第一遍,理解成分为40%第二遍,理解成分为第二遍,理解成分为52%第三遍,理解成分为第三遍,理解成分为65%第四遍,理解成分为第四遍,理解成分为75%第五遍,理解成分为第五遍,理解成分为86%第六遍,理解成分为第六遍,理解成分为97%求阅读能力随阅读遍数的求阅读能力随阅读遍数的平均增加比率平均增加比率。 2024/8/3134二、二、离散量离散量n离散量离散量:反映一组数据反映一组数据离散趋势或离散离散趋势或离散程度程度的统计量,用

18、来表示一组数据的分的统计量,用来表示一组数据的分散情况。散情况。n次数分布的两个基本特征次数分布的两个基本特征:中心位置中心位置与与离散性离散性2024/8/3135图例2024/8/3136离散量离散量方方差差与与标标准准差差标准分数标准分数全全距距平平均均差差差差异异系系数数离散量的种类离散量的种类n相对差相对差异量异量n绝对绝对差异量差异量2024/8/3137(一)全距(一)全距n全距全距:即一组数据中最大值与最小值的:即一组数据中最大值与最小值的差。常用大写字母差。常用大写字母R表示。表示。(Range=Max-Min)n用全距表示一组数据的离散程度是非常用全距表示一组数据的离散程度

19、是非常粗略粗略和和不准确不准确的。的。2024/8/3138(二)平均差(二)平均差n平均差平均差:每一个观测值与平均数的距离:每一个观测值与平均数的距离的和的平均。用的和的平均。用AD(average deviation)表示。)表示。2024/8/3139平均差的应用平均差的应用n平平均均差差是是用用来来表表示示一一组组数数据据离离散散程程度度的的较好的较好的差异量数,差异量数,反应灵敏,确定严密反应灵敏,确定严密。n缺缺点点是是在在计计算算时时要要取取绝绝对对值值,不不利利于于代代数数方方法法的的运运算算;也也不不利利于于进进一一步步的的统统计计分析。分析。 2024/8/3140(三)

20、方差与标准差(三)方差与标准差1、基本定义、基本定义n方方差差(Variance):也也叫叫变变异异数数、均均方方,是是每每个个观观测测值值与与该该组组数数据据的的平平均均数数之之差差平平方方后后和的均值,即和的均值,即离均差平方和的平均数离均差平方和的平均数。n样样本本方方差差和和总总体体方方差差的的计计算算方方法法和和含含义义是是一一致致的的,但但符符号号不不同同,前前者者用用S2表表示示 ,后后者者用用2表示。表示。n标准差(标准差(Standard deviation):即:即方差的平方差的平方根方根,样本方差常用符号,样本方差常用符号S或或SD表示,总体表示,总体方差则用方差则用表示

21、。表示。 2024/8/31412、方差与标准差的计算公式、方差与标准差的计算公式2024/8/3142练习练习试推导用原始数据计算方差和标准差的公试推导用原始数据计算方差和标准差的公式。式。2024/8/3143计算并思考计算并思考计计算算下下列列四四组组数数据据的的平平均均数数,并并找找出出每每组组数数据据的最大值和最小值:的最大值和最小值:A7、7、8、8、8、9、9B4、5、7、8、9、11、12C1、4、7、8、9、12、15D 1、8、8、8、8、8、15n思考:这四组数据有什么不同?思考:这四组数据有什么不同?n仅仅仅仅用用平平均均数数能能不不能能反反映映这这组组数数据据的的所所

22、有有特特性?为什么?性?为什么?2024/8/31443、标准差的性质、标准差的性质n一组数据的每一个观测值都加上一个常一组数据的每一个观测值都加上一个常数数C,其标准差不变。,其标准差不变。 n一组数据的每一个观测值都乘以一个常一组数据的每一个观测值都乘以一个常数数C,其标准差为原标准差乘以,其标准差为原标准差乘以常数常数C。2024/8/3145证明并思考证明并思考n试证明上述标准差的性质并思考在每种试证明上述标准差的性质并思考在每种情况下数据情况下数据分布形态的变化分布形态的变化。2024/8/31464、方差与标准差的意义、方差与标准差的意义n方方差差与与标标准准差差是是表表示示一一组

23、组数数据据离离散散程程度度的的最好指标最好指标,具有以下优点:,具有以下优点:n反反应应灵灵敏敏,每每个个数数据据取取值值的的变变化化,方方差差与与标准差都会随之变化;标准差都会随之变化;n有一定的计算公式有一定的计算公式严密确定严密确定;n容易计算并适合代数运算容易计算并适合代数运算;2024/8/31474、方差与标准差的意义、方差与标准差的意义n受抽样变动的影响小受抽样变动的影响小;n具有可加性具有可加性,因此可以分解并确定出属于,因此可以分解并确定出属于不同来源的不同来源的变异性变异性,并可进一步说明每种,并可进一步说明每种变异对总结果的影响,是以后统计推论部变异对总结果的影响,是以后

24、统计推论部分常用的统计特征数。分常用的统计特征数。2024/8/3148(四)标准分数及其应用(四)标准分数及其应用1、标准分数(、标准分数(Standard Score):又称又称基基分数分数或或Z分数分数,是以,是以标准差为单位标准差为单位表示表示一个分数在团体中所处位置的一个分数在团体中所处位置的相对位置相对位置量数量数。 2024/8/31492、标准分数的计算、标准分数的计算n其中:其中:Xi代表原始分数代表原始分数n 为一组数据的平均数为一组数据的平均数nS为标准差。为标准差。 2024/8/3150例子例子n计算计算B B组各数据的组各数据的Z Z分数及其和分数及其和2024/8

25、/31513、Z分数的性质分数的性质n在在一一组组数数据据中中,所所有有由由原原分分数数转转换换得得出出的的Z分分数数之之和和为为0,其其Z分分数数的的平平均均数数也也为为0。n一组数据中各一组数据中各Z分数的分数的标准差为标准差为1。2024/8/31524、Z分数的应用分数的应用nZ分分数数可可用用于于比比较较一一组组数数据据中中的的观观测测值值在在该该组组数数据据中中的的相相对对位位置置,并并可可根根据据Z分分数数的的大大小小判判断断该该数数据据距距离离中中心心位位置置的的远近。远近。2024/8/31534、Z分数的应用分数的应用nZ分分数数可可用用于于比比较较性性质质不不同同的的观观

26、测测值值在在各自数据分布中各自数据分布中相对位置的高低相对位置的高低。例例子子:我我市市3 3岁岁幼幼儿儿的的平平均均身身高高为为9090公公分分,标标准准差差为为2020公公分分;平平均均体体重重为为1010公公斤斤,标标准准差差为为5 5公公斤斤。现现有有一一3 3岁岁幼幼童童身身高高100100公公分分,体体重重1515公公斤。问该儿童是身高偏高?还是体重更偏重?斤。问该儿童是身高偏高?还是体重更偏重?2024/8/31544、Z分数的应用分数的应用n当已知同一样本或对象当已知同一样本或对象各不同质各不同质的观测的观测值的次数分布为正态时,可用值的次数分布为正态时,可用Z分数求分数求不同

27、的观测值的不同的观测值的总和或平均值总和或平均值。例子:甲、乙、丙三生的某四门功课的成绩如例子:甲、乙、丙三生的某四门功课的成绩如下表,试问三生的总体学习成绩孰优孰劣?下表,试问三生的总体学习成绩孰优孰劣?2024/8/3155课程课程A课程课程B课程课程C课程课程D甲甲81807278乙乙94649091丙丙72606774全班平全班平均成绩均成绩72.969.46772.6标准差标准差12.713.21411.42024/8/31564、Z分数的应用分数的应用nZ分数可用来表示标准测验的分数。分数可用来表示标准测验的分数。经经过过标标准准化化的的心心理理与与教教育育测测验验,如如果果其其常

28、常模模分分数数分分布布接接近近正正态态分分布布,常常常常转转换换成成正正态态标标准准分分数数,能能更更清清楚楚地地表表明明某某一一分分数在相应团体中的位置数在相应团体中的位置。2024/8/3157其转换公式为:其转换公式为:Z=aZ+b其中:其中:Z为正态标准分数为正态标准分数 a 、b为为常常数数,通通常常为为该该测测验验总总的的标标准准差差和总平均数和总平均数,有时也用经验分数。有时也用经验分数。 X为原分数为原分数 为为某团体(或年龄组)某团体(或年龄组)的平均分数的平均分数 S S为为该团体或年龄组该团体或年龄组的标准差的标准差2024/8/3158一些测验的常模一些测验的常模Z分数

29、分数 0, 12T分数分数 50, 102GRE,SAT500,1002WechlerIQ100, 152SbIQ100, 1622024/8/3159练习并证明练习并证明n例一:某校大二学生分属三个学院,全部参例一:某校大二学生分属三个学院,全部参加了某次英语四级考试,其成绩见下表,试加了某次英语四级考试,其成绩见下表,试计算该校大二学生计算该校大二学生CET-4平均成绩和总的标平均成绩和总的标准差。并找出计算总标准差的通用公式。准差。并找出计算总标准差的通用公式。学院学院A学院学院B学院学院C平均数平均数747065标准差标准差251030人数人数100120802024/8/3160方差

30、的可加性证明方差的可加性证明2024/8/3161方差的可加性证明方差的可加性证明n在上式中,总的方差(变异)被分成两在上式中,总的方差(变异)被分成两部分,前一部分可看作是组内方差或部分,前一部分可看作是组内方差或由由组内原因引起的变异组内原因引起的变异(如被试内的差异)(如被试内的差异) ;后一部分可看作是组间的方差或由;后一部分可看作是组间的方差或由不不同的组引起的变异同的组引起的变异(如实验中不同的变(如实验中不同的变量)量) 。2024/8/3162方差的可加性证明方差的可加性证明n因因此此,标标准准差差是是反反映映一一组组数数据据离离散散程程度度的的高高效效差差异异量量。对对于于两

31、两组组同同质质的的数数据据来来说说,要要比比较较它它们们之之间间的的离离散散程程度度,就就要要用用标标准准差差的的大大小小来来衡衡量量,标标准准差差大大,说说明明该该组组数数据据较较分分散散,标标准准差差小小,说说明明该该组数据较集中。组数据较集中。2024/8/3163例例二二:试试分分析析例例一一中中三三个个学学院院CET-4成成绩绩分布的分散程度。分布的分散程度。例例三三:已已知知某某小小学学一一年年级级学学生生的的平平均均体体重重为为25公公斤斤,体体重重的的标标准准差差为为3.7公公斤斤,平平均均身身高高为为110厘厘米米,身身高高标标准准差差为为6.2厘厘米米,问问身身高高与与体体

32、重重的的离离散散程程度度哪哪一一个个大?大?2024/8/3164n利用标准差进行比较是有严格条件的:利用标准差进行比较是有严格条件的:即进行比较的数据组是对即进行比较的数据组是对同一特质同一特质用用同同一种测量工具一种测量工具进行测量而获得的,并且进行测量而获得的,并且样本的总体之间差异不大样本的总体之间差异不大,即样本平均,即样本平均数差异不大。数差异不大。n这是一个绝对差异量。这是一个绝对差异量。2024/8/3165(五)差异系数(五)差异系数n这这样样,如如果果两两个个样样本本水水平平相相差差较较大大,就就要借助要借助相对差异量相对差异量来进行比较。来进行比较。n最常用的相对差异量就

33、是最常用的相对差异量就是差异系数差异系数。1 1、差差异异系系数数:又又叫叫变变异异系系数数、相相对对标标准准差差等等,通通常常用用符符号号CV表表示示。其其计计算算公公式如下:式如下: 2024/8/31662、差异系数的应用条件、差异系数的应用条件n同同一一团团体体不不同同特特质质观观测测值值离离散散程程度度的的比比较;较;n进进行行的的是是同同一一种种观观测测,但但水水平平相相差差较较大大的的各各种种团团体体,进进行行观观测测值值离离散散程程度度的的比比较;较;n此此外外,适适用用于于用用差差异异系系数数进进行行比比较较的的测测量量值值最最好好是是比比率率变变量量,如如重重量量、长长度度

34、、时间和编制得好的测验量表。时间和编制得好的测验量表。2024/8/3167例例四四:今今有有一一画画线线实实验验,标标准准线线分分别别为为5厘厘米米及及10厘厘米米,实实验验结结果果5厘厘米米组组的的误误差差平平均均数数为为1.3厘厘米米,标标准准差差为为0.7厘厘米米;10厘厘米米组组的的误误差差平平均均数数为为4.3厘厘米米,标标准准差差为为1.2厘厘米米。请请问问,如如何何比比较较其其离离散程度的大小?散程度的大小?2024/8/31683、差异系数的缺点、差异系数的缺点n差差异异系系数数的的缺缺点点主主要要在在于于它它只只能能用用于于一一般般的的相相对对差差异异量量的的描描述述上上,

35、至至今今尚尚无无有有效效的的假假设设检检验验方方法法,因因此此对对差差异异系系数数不不能进行统计推论能进行统计推论。2024/8/3169三、地位量数三、地位量数n表示一个原始分数在其所处分布中地位表示一个原始分数在其所处分布中地位的量数,叫地位量数。的量数,叫地位量数。n种类:种类:n百分位分数百分位分数n百分等级分数百分等级分数n标准分数标准分数nT分数分数n2024/8/3170(一)百分位分数(一)百分位分数n把一个次数分布排序之后,分为把一个次数分布排序之后,分为100个个单位,则某个特定百分点对应的原始分单位,则某个特定百分点对应的原始分数即为数即为百分位分数百分位分数,它表明在次

36、数分布,它表明在次数分布中有该特定百分数的数据低于该分数。中有该特定百分数的数据低于该分数。n通常用通常用P加下标加下标m(代表某个特定百分(代表某个特定百分点)表示。点)表示。n如:如:P75=78代表有代表有75%的数据小于的数据小于78。2024/8/3171(一)百分位分数(一)百分位分数n计算公式计算公式2024/8/3172(一)百分位分数(一)百分位分数2024/8/3173(一)百分位分数(一)百分位分数n例:例:n在上表中在上表中,假设老师要对全班的前假设老师要对全班的前15%的学生进行奖励的学生进行奖励,请问至少要多少分才请问至少要多少分才能获得奖励能获得奖励.2024/8

37、/3174(一)百分位分数(一)百分位分数n一些常用的百分位数一些常用的百分位数nQ1=即第即第25%点对应的原始分数,是第点对应的原始分数,是第一个四分位数一个四分位数nQ2,第二个四分位数,第二个四分位数nQ3,第三个四分位数,第三个四分位数nQ3-Q1 =QD,叫,叫四分位距四分位距,是比全距更,是比全距更好的离散量指标。好的离散量指标。2024/8/3175(二)百分等级分数(二)百分等级分数n某个已知原始分数在其所处分布中的相某个已知原始分数在其所处分布中的相对位置叫对位置叫百分等级分数百分等级分数。n通常用通常用PR表示。表示。2024/8/3176(二)百分等级分数(二)百分等级

38、分数n计算公式计算公式2024/8/3177(二)百分等级分数(二)百分等级分数n例:例:n在上表中在上表中,假设某位学生考了假设某位学生考了76分,请分,请问全班有多少人排在他的前面?问全班有多少人排在他的前面?2024/8/3178百分位分数与百分等级分数百分位分数与百分等级分数n二者都是用来表示个体在团体中的相对二者都是用来表示个体在团体中的相对地位;地位;n计算过程相反,一个是由百分数计算原计算过程相反,一个是由百分数计算原始分数,另一个是由原始分数计算百分始分数,另一个是由原始分数计算百分数。数。2024/8/3179次数分布的分布形态次数分布的分布形态n正态分布与偏态分布正态分布与

39、偏态分布n正态分布正态分布(normal distribution):以平均数为):以平均数为中心位置的对称分布。中心位置的对称分布。n偏态分布(偏态分布(skewed distribution):非对称分布。):非对称分布。n正偏态分布正偏态分布(positive skewed):次数分布中低分数偏):次数分布中低分数偏多,尾部在高分端(右端),也叫右偏分布。多,尾部在高分端(右端),也叫右偏分布。n负偏态分布负偏态分布(negative skewed):次数分布中高分数):次数分布中高分数偏多,尾部在低分端(左端),也叫左偏分布。偏多,尾部在低分端(左端),也叫左偏分布。2024/8/31

40、80图例2024/8/3181图例2024/8/3182次数分布的分布形态次数分布的分布形态n不同分布中平均数、中数及众数之间的关系:不同分布中平均数、中数及众数之间的关系:分布分布关系关系正态分布正态分布M=Md=Mo正偏态分布正偏态分布MMd Mo负偏态分布负偏态分布MMd Mo2024/8/3183练习练习2024/8/31842024/8/31852024/8/31862024/8/31872024/8/31882024/8/31892024/8/3190四、相关分析四、相关分析(一)基本概念(一)基本概念1、相关与相关分析、相关与相关分析v相相关关:即即两两类类现现象象在在发发展展变

41、变化化的的方方向向与与大小大小方面存在一定的关系。方面存在一定的关系。v相相关关分分析析:用用一一些些合合理理的的指指标标对对相相关关事事物物的的观观测测值值进进行行统统计计分分析析,以以判判断断两两事事物相关的程度,称为相关分析。物相关的程度,称为相关分析。2024/8/31912、相关、因果、共变、相关、因果、共变因果关系因果关系:一种现象是另一种现象的因,另:一种现象是另一种现象的因,另一种现象则是果。一种现象则是果。共变关系共变关系:即表面看起来有联系的两种事物:即表面看起来有联系的两种事物都与都与第三种第三种事物有关。也就是说这两种事物事物有关。也就是说这两种事物之间的关系并不是一种

42、之间的关系并不是一种实质性实质性的关系,而是的关系,而是因为它们都与第三者有关,才具有的因为它们都与第三者有关,才具有的表面上表面上的关系。的关系。相关关系内也可能包含因果关系或共变关系,相关关系内也可能包含因果关系或共变关系,但但仅从相关程度不能作出判断仅从相关程度不能作出判断。2024/8/31923、相关的种类、相关的种类v根根据据具具有有相相关关关关系系的的两两个个变变量量在在变变化化方方向向和大小和大小上的关系,可以把相关分为三类:上的关系,可以把相关分为三类:v负相关负相关:v即即两两个个变变量量变变化化的的方方向向相相反反,也也就就是是说说,一一个个变变量量变变动动时时,另另一一

43、个个变变量量也也发发生生变变动动但但方方向正好与前一变量的方向相反。向正好与前一变量的方向相反。2024/8/31933、相关的种类、相关的种类v正相关正相关:v即即两两个个变变量量变变化化的的方方向向相相同同,也也就就是是说说,一一个个变变量量变变动动时时,另另一一个个变变量量也也同同时时发发生生或大或小与前一变量同方向的变动。或大或小与前一变量同方向的变动。v零相关零相关:v即即两两列列变变量量之之间间没没有有关关系系,也也就就是是说说两两个个变变量量的的变变动动在在方方向向和和大大小小方方面面没没有有任任何何关关系,二者是系,二者是独立的随机变量独立的随机变量。2024/8/31944、

44、相关系数、相关系数q相关系数相关系数:用来表示两个具有相关关系:用来表示两个具有相关关系的变量之间相关程度的数值。的变量之间相关程度的数值。q通常样本的相关系数用通常样本的相关系数用r(relationship)表表示。示。q总体的相关系数用总体的相关系数用表示。表示。2024/8/3195例一例一n现测得十名女模特的身高和体重见下表现测得十名女模特的身高和体重见下表,请问模特的身高和体重之间的相互关系如请问模特的身高和体重之间的相互关系如何何?(身高单位为厘米身高单位为厘米;体重单位为公斤体重单位为公斤)2024/8/3196巴西21岁女模特安娜卡罗琳雷斯顿 2024/8/3197模特模特1

45、2345678910身高身高174 170165172176178168183 170160体重体重40504449656144655244干瘦干瘦型身型身高高183 180177174156165159171 168162体重体重848076724860526864562024/8/31985、协方差(、协方差(Covariance)其中其中n为成对的变量数为成对的变量数2024/8/3199协方差的含义协方差的含义通通过过两两变变量量离离均均差差乘乘积积的的大大小小和和取取值值的的正正负负,能能够够反反映映出出此此两两列列变变量量的的变变动动在在方方向向和和大大小小上上的的关关系系,即即能

46、能够够反反映映两两变变量相互之间的关系。量相互之间的关系。思思考考:协协方方差差在在表表示示两两变变量量相相关关程程度度上上有有什么局限?什么局限?2024/8/31100n在上例中,若把身高的单位换算为米,在上例中,若把身高的单位换算为米,再计算身高和体重的协方差,这时的协再计算身高和体重的协方差,这时的协方差和上一个协方差有什么不同?方差和上一个协方差有什么不同?n造成这种差异的原因是什么?造成这种差异的原因是什么?n这说明了什么问题?这说明了什么问题?2024/8/31101协方差的缺陷协方差的缺陷协方差是有协方差是有单位单位的。的。两两变变量量的的测测量量单单位位不不同同,协协方方差差

47、的的单单位位也也是是不不同同的的,而而且且任任何何一一个个变变量量的的测测量量单单位位的的变变化化,都都会会引引起起协协方方差差的的值值的的变变化化,因此协方差是因此协方差是不稳定不稳定的。的。思考:如何克服协方差的这一缺点?思考:如何克服协方差的这一缺点?2024/8/31102(二)积差相关(二)积差相关v英英国国的的统统计计学学家家皮皮尔尔逊逊(Pearson)于于20世世纪纪初初提提出出了了积积差差相相关关概概念念,用用来来计计算算线性线性关系的两列变量的相关程度。关系的两列变量的相关程度。2024/8/311031、积差相关系数的计算、积差相关系数的计算2024/8/31104用原始

48、数据计算用原始数据计算2024/8/31105例二例二:完全正相关与完全负相关完全正相关与完全负相关X1516171819Y2223242526Z2625242322P34353436352024/8/311062、相关系数的性质、相关系数的性质相关系数的取值范围为相关系数的取值范围为-1r1。相关系数取值的正负号表示相关的方向。相关系数取值的正负号表示相关的方向。取值大小仅表示两变量相关的程度。取值大小仅表示两变量相关的程度。相相关关系系数数只只是是一一个个比比率率,没没有有单单位位也也不不是是等等距的度量值,不能进行代数运算。距的度量值,不能进行代数运算。相相关关系系数数只只能能描描述述两

49、两个个变变量量之之间间的的变变化化方方向向同同密密切切程程度度,并并不不能能揭揭示示二二者者之之间间的的内内在在本本质联系质联系。2024/8/311073、积差相关的适用范围、积差相关的适用范围v两变量的数据都为两变量的数据都为等距或等比等距或等比数据;数据;v两两变变量量所所代代表表的的总总体体的的分分布布形形态态都都为为正正态分布态分布或或接近接近正态分布;正态分布;v两变量之间的关系是两变量之间的关系是直线性直线性的;的;v要要排除排除共变因素的存在;共变因素的存在;v样本的容量样本的容量n30。2024/8/31108问题与思考问题与思考v如何判断总体分布的形态?如何判断总体分布的形

50、态?v如何确定两变量为线性关系?如何确定两变量为线性关系?v如何排除共变关系的存在?如何排除共变关系的存在?2024/8/31109相关散点图的绘制相关散点图的绘制v方方法法一一:对对于于两两变变量量X、Y,以以X为为横横坐坐标标,Y为为纵纵坐坐标标画画一一直直角角坐坐标标系系,以以两两变变量量的的成成对对测测量量值值(X,Y)在在坐坐标标系系内描点,即构成内描点,即构成相关散布图相关散布图。v方方法法二二:先先计计算算两两变变量量X、Y的的每每一一个个测测量量值值的的Z分分数数,以以Z分分数数为为坐坐标标,以以成成对对的的(ZX,ZY)在在坐坐标标系系内内描描点点,即可得到更清楚的相关关系散

51、点图。即可得到更清楚的相关关系散点图。2024/8/311102024/8/31111例三例三被试被试12345678910X(排名)排名)45.59732815.510Y (排排名)名)105861.5371.5492024/8/31112(三)斯皮尔曼(三)斯皮尔曼(Spearman)等级相关等级相关1、适用条件:、适用条件:只有只有两列等级变量两列等级变量两变量是两变量是线性线性关系关系非正态分布非正态分布的等距或比率变量的等距或比率变量2024/8/311132、计算方法、计算方法2024/8/31114思考思考n等级相关和积差相关的关系?等级相关和积差相关的关系?2024/8/311

52、153、积差相关与等级相关、积差相关与等级相关v等级相关是积差相关的等级相关是积差相关的特例特例v二者可以二者可以互相推导互相推导v等级相关引进了计算误差,没有积差相等级相关引进了计算误差,没有积差相关精确,关精确,能够用积差相关计算的数据一能够用积差相关计算的数据一定不能用等级相关计算。定不能用等级相关计算。2024/8/31116用等级序数求相关用等级序数求相关2024/8/31117例四例四被被评评者者评价者评价者12345678910红红3523443243橙橙6676757766黄黄5457664454绿绿1112222112青青4344335635蓝蓝2231111321紫紫776

53、55765772024/8/31118(四)肯德尔(四)肯德尔W系数系数又又叫叫肯肯德德尔尔和和谐谐系系数数(the Kendall coefficient of concordance),用用rW表表示。示。2024/8/311191、适用条件、适用条件两列以上两列以上等级变量之间的相关程度。等级变量之间的相关程度。在心理与教育研究中,肯德尔和谐系数在心理与教育研究中,肯德尔和谐系数常用来考察常用来考察评分者的一致性程度评分者的一致性程度。评定有两种情况,即不同评定者对同一评定有两种情况,即不同评定者对同一组个体的等级评定,或者同一评定者对组个体的等级评定,或者同一评定者对同一个体等级的几次

54、评定。同一个体等级的几次评定。2024/8/311202、计算公式、计算公式 2024/8/311212024/8/31122问题与思考问题与思考肯德尔和谐系数的取值有什么特点?肯德尔和谐系数的取值有什么特点?为什么?为什么?2024/8/31123(六)质与量的相关(六)质与量的相关定义:所谓定义:所谓质与量的相关质与量的相关是指一列变量是指一列变量为为等比或等距的测量数据等比或等距的测量数据,另一列变量,另一列变量是是按性质按性质划分的类别(即划分的类别(即名义变量名义变量),),这两列变量的相关即质与量的相关。这两列变量的相关即质与量的相关。内容:点二列相关;二列相关;多系列内容:点二列

55、相关;二列相关;多系列相关相关2024/8/31124例五例五n现有现有18个五岁幼儿投掷砂袋个五岁幼儿投掷砂袋(150克克)的成绩见下表的成绩见下表,问性问性别与投掷成绩的相关情况如何别与投掷成绩的相关情况如何?序号序号123456789成绩成绩4.03.63.53.24.44.83.85.24.7性别性别男男女女女女女女男男男男女女男男男男序号序号101112131415161718成绩成绩3.44.93.73.34.77.83.12.93.4性别性别女女男男女女女女男男男男女女女女女女2024/8/311251、点二列相关、点二列相关适用条件:适用条件:属于测量数据的变量其总体分布为属于

56、测量数据的变量其总体分布为正态正态另一列变量是按事物的另一列变量是按事物的性质性质划分为划分为两类两类这类按性质划分为两类的变量叫这类按性质划分为两类的变量叫二分名二分名义变量。义变量。2024/8/31126计算公式计算公式2024/8/31127应用应用点二列相关常用于编制点二列相关常用于编制是非题测验是非题测验时评时评价测验的价测验的内部一致性内部一致性问题问题一测验中某一项目的一测验中某一项目的区分度区分度即被试在该即被试在该项目上的成绩与测验总成绩之间的相关项目上的成绩与测验总成绩之间的相关在心理与教育研究中点二列相关常用于在心理与教育研究中点二列相关常用于考察考察不同性别的被试在某

57、一心理现象上不同性别的被试在某一心理现象上的相关程度的相关程度(如例五如例五)。2024/8/31128例六例六n下表为下表为10名小学一年级学生某一语言能力名小学一年级学生某一语言能力测验结果及其期末语文考试的通过情况测验结果及其期末语文考试的通过情况.序号序号12345678910语言语言能力能力测验测验95786984828655749088语文语文通过通过情况情况过过未未过过未未过过过过过过过过未未过过未未过过过过过过2024/8/311292、二列相关、二列相关适用条件适用条件两列变量都是总体为两列变量都是总体为正态分布的连续变量正态分布的连续变量其中一列变量被人为地划分为两类,成为

58、其中一列变量被人为地划分为两类,成为二分变量二分变量两列变量之间是线性关系两列变量之间是线性关系样本容量样本容量N802024/8/31130计算公式计算公式2024/8/31131应用应用二列相关常用于对二列相关常用于对非非是非测验项目区分是非测验项目区分度指标的确定度指标的确定2024/8/311323、多系列相关、多系列相关适用条件适用条件:n两列变量都为正态分布的连续变量两列变量都为正态分布的连续变量n其中一列变量被人为地分成多种类别,其中一列变量被人为地分成多种类别,即成为名义变量。即成为名义变量。n则该两列变量的相关称为多系列相关:则该两列变量的相关称为多系列相关:若分成三类,就称为三系列相关,其余若分成三类,就称为三系列相关,其余类同。类同。2024/8/31133练习练习2024/8/31134

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号