体育统计(数据特征).ppt

上传人:re****.1 文档编号:570181539 上传时间:2024-08-02 格式:PPT 页数:55 大小:289.51KB
返回 下载 相关 举报
体育统计(数据特征).ppt_第1页
第1页 / 共55页
体育统计(数据特征).ppt_第2页
第2页 / 共55页
体育统计(数据特征).ppt_第3页
第3页 / 共55页
体育统计(数据特征).ppt_第4页
第4页 / 共55页
体育统计(数据特征).ppt_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《体育统计(数据特征).ppt》由会员分享,可在线阅读,更多相关《体育统计(数据特征).ppt(55页珍藏版)》请在金锄头文库上搜索。

1、第三章第三章 样本特征数样本特征数一、集中量数一、集中量数o由频数分布表可看出频数分布的两个重要特征:集中趋势集中趋势和离散程度离散程度。 如:例2.2,身高有高有矮,但中等身高居多,此为集中趋势;由中等身高到较矮或较高的频数分布逐渐减少,反映了离散程度。o对于数值变量资料,可从集集中中趋趋势势和离离散散程度程度两个侧面去分析其规律性。o集中趋势:在一组数据中变量值集中的位置(数据分布最密集的位置)。o集中量数:反映集中趋势的统计量称为集中量数。常用的集中量数有: (1)算术平均数 (2)中位数 (3)众数1 1、算术平均数、算术平均数o定义:所有观察值之和除以总频数,简称均数。 样本均数:

2、总体均数:o含义:反映同质研究对象观察值的平均水平平均水平与集中趋势集中趋势的统计量。 算术平均数的计算方法(1)直接法:由观察值直接计算,用于样本含量较少时,其公式为: 式中,希腊字母表示求和; X1,X2,Xn为各观察值; n为样本含量,即观察值的个数。o例1:某少年组运动员10人,立定跳远成绩(单位:米)如下表试求其均值。(p26例3.1)解: 返回编号编号1 12 23 34 45 56 67 78 89 91010成绩成绩2.722.722.682.682.782.782.832.832.622.622.812.813.093.093.003.002.942.942.892.89(2

3、)加权法:当资料中出现相同观察值时,可将相同观察值的个数(即频数)与该观察值 X 的乘积代替相同观察值逐个相加,即 X1 , X2 , , Xk f1 , f2 , , fk其公式为:o例2:某人50发射击成绩如下表,试求其均数。 (p16例2.1)o解:环数 5 6 8 9 10频数 4 3 18 22 3(3)简捷法:主要是针对连续型频数分布表,是加权法的一种变形形式。其公式为: 式中: :所在组的组下限 f:该组的频数 i:组距 身 高 频 数11511183121812410127201301913312136413921421451总和80例3:80名上海市小学二年男生身高数据如下表

4、:求其均值。(p16例2.2)解:算术平均数的适应范围及优缺点算术平均数的适应范围及优缺点o优点:(1)均数作为反映变量的集中量数,既考虑到频次的多少,又考虑到每一个变量值的大小,故它是可靠的可靠的、灵敏的灵敏的,也是对资料提供信息运用最充分的充分的。(2)均数适合代数运算,计算方便,因此是一个用途最广、效果最好的集中量数。o缺点:缺点: (1)均数易受少数极端数据极端数据的影响而大大改变其数值,从而相对削弱它作为集中量数的代表性。o适应范围:适应范围: 数据严重偏态分布时,一般不用均数反映它的集中趋势。一般应用于正态或近似正态正态或近似正态的数据。o给定一组数据资料,如何判断是否适合选用算术

5、均数来表达其平均水平呢?(1)如果是小样本,可用目测法:如果数据相差不太悬殊,将数据由小到大排列后,较小和较大的数据个数基本相等,且关于最中间的数据基本对称即可。(2)如果大样本,将其按一定组距分组,若居中的组段内频数最大,而且在该组前后的组段内的频数逐渐减少且基本对称,也适合用算术均数。关于集中趋势的讨论o集中趋势反映的是位置,不能比较大小。 例: 甲班体育统计平均成绩 乙班体育统计平均成绩 上式反映的是:乙班的成绩比甲班好(平均水平),而不能说乙班的集中趋势比甲班大。2、中位数o定义: 是把各个变量值按大小顺序排列排列后,位于序列中间的数,称为中位数,是一种位置指标位置指标,反映数据集中趋

6、势的一个统计量。记为: o含义:反映一组观察值在位置上的平均水平。中位数的计算o离散型数据(1)数据个数为奇数个时:(2)数据个数为偶数个时:p连续型数据(略)例4:求下列两组数的中位数(1)14,2,17,9,22,13,1,7,11(2)1,26,11,9,14,13,7,17,22,2解:先排序 (1)1,2,7,9,1111,13,14,17,22 该组的中位数为: 1111 (2) 1,2,7,9,1111,1313,14,17,22,26 该组的中位数为:优缺点及适用条件优缺点及适用条件o优缺点:优缺点: (1)由于中位数只受居中变量值的影响,故它不够灵敏、充分。 (2)不会受到极

7、端数据的影响。o适用条件:适用条件: 适用于任何分布资料,特别是偏态分布、分布不明、分布末端无确定值。极端数据极端数据对均数和中位数影响的举例对均数和中位数影响的举例例5:分别求下列两组数的均数和中位数。均数和中位数。 (1)1,2,7,9,1111,13,14,17,22 (2)1,2,7,9,1111,13,14,17,100解:解:(1 1)中位数为:)中位数为:11 11 均数为:均数为:10.6710.67 (1 1)中位数为:)中位数为:11 11 均数为:均数为:19.3319.333、众数o定义:在一次实验中出现次数(频数)最多的观察值;在频数分布表中对应于数据最集中所在位置的

8、观察值。记作:o适应条件:适用于大样本;较粗糙。例6:某班体育考试成绩如下表:该组数据的众数:分分 数数70707171727273737474757576767777787879798080频频 数数2 24 46 6141411119 97 75 54 43 31 14、均数、中位数、众数三者关系o正态分布时: 均数中位数众数o右偏态分布时:均数中位数众数o左偏态分布时:均数中位数众数常用集中趋势指标及应用条件常用集中趋势指标及应用条件集中趋指标集中趋指标 应用场合应用场合算术均数算术均数适用于对称分布,特别是正态适用于对称分布,特别是正态分布分布众数众数大样本,较粗糙。大样本,较粗糙。中

9、位数中位数适用于任何分布资料,特别是适用于任何分布资料,特别是偏态分布、分布不明、分布末偏态分布、分布不明、分布末端无确定值端无确定值二、离散量数例7:两组学生的引体向上成绩如下: 甲组:3,5,5,5,5,6,6 乙组:1,2,4,5,6,8,9 从该上述资料中两组数据我们可以看出: (1)甲组和乙组的平均成绩都是5。 (2)这两组数据的分布特征不尽相同,各组的7个数据间参差不齐的程度是不一样的。 (3)根据常识:我们会认为甲组的成绩比乙组好。o离散程度(变异程度): 反映数据分布的密集程度。o离散量数:离散量数:反映数据离散程度的指标称为离散量数。 常用的离散量数: 1、全距 2、方差、标

10、准差 3、变异系数1、全距(极差)o定义:该组数据的最大值与最小值的差。o计算方法:R=max-min 例7中: 因为 : 所以:甲组成绩的离散程度(变异程度)小于乙组成绩。o优缺点: (1)计算简单方便。 (2)只反映出该组数据资料中最大值与最小值的信息,其他数据信息反映不充分。 (3)只能比较数据数目相同的同质数据。o适用条件: 样本含量较小时,数据分布相对比较均匀的数据。2、离均差平方和o 表示所有数到均数差的代数和。o 的几何解释:表示各点到均数距离的和。o由于该值为零,无法反映数据的离散程度,但是对我们找一个合适的指标来反映离散程度有一定启发意义。o 表示所有数到均数差的绝对值的和。

11、o 的几何解释:表示各点到均数路程的和。 如果这个值越小则离散程度就越小,反之亦然。o优点:反映的信息充分。o缺点: (1)只能比较数据数目相同的同质数据。 (2)式中包含绝对值符号。 o :离均差平方和,表示所有数和均数差的平方的代数和。 o离均差平方和的含义: 表示所有数据的总变异即总的离散程度。o优点:充分、灵敏、严密确定。o缺点:只能比较数据数目相同的同质数据。o为什么我们一般不使用离均差平方和来反映数据的离散程度(变异程度)? 例:现在有两个班同时在学习体育统计,甲班有45人,乙班有40人,考试结束后,比较两个班的体育统计成绩?是分别比较两个班的总分还是平均分? 结果是显而易见的:比

12、较平均分,因为两个班的人数不相等。o 离均差平方和就相当于这里的总分。3、方差o定义:离均差平方和除以该组数据的总频数。 其公式为: n-1: 自由度总体方差:样本方差:o含义:表示每个观察值的平均离散程度,方差越大,说明数据的离散程度越大。o优点:(1)灵敏性灵敏性、严密确定严密确定、充分性充分性。(2 2)可以比较不同不同数目同质数据同质数据的各组数据资料。o缺点:(1)容易受到极端数据极端数据影响。(2 2)它的单位与观察值的单位不同,是观察值单位的平方平方,这给我们解释实际问题造成了一些麻烦。 4、标准差o定义:方差的平方根。其公式为: 式中, n-1: 自由度o含义:反映每个数据的平

13、均离散程度,标准差越大,说明数据的离散程度越大。 总体标准差:样本标准差:标准差的优缺点及适用条件o优缺点:(1)灵敏性灵敏性、严密确定严密确定、充分性充分性。(2)标准差能对平均数平均数的代表性代表性作出 补充说明。 标准差越大,表明这组数据的离散程度越大,平均数的代表性越差;标准差越小,表明这组数据的离散程度越小,平均数的代表性越好。(3)与方差相比,标准差更容易解释实际问题。(4)易受极端数据极端数据的影响。o适用条件:(1)数据分布相对比较均匀,正态或近似正态的数据。标准差的计算方法(1)直接法:用于样本量较小的资料。其公式为:其中:o例8:某少年组运动员10人,立定跳远成绩(单位:米

14、)如下表试求其标准差。(p26例3.1)解: 编号编号1 12 23 34 45 56 67 78 89 91010成绩成绩2.722.722.682.682.782.782.832.832.622.622.812.813.093.093.003.002.942.942.892.89(2)加权法:用于样本量较大的离散型频数表资料。 其公式:其中,o例9:某人50发射击成绩如下表,试求其标准差。 (p16例2.1)o解:环数 5 6 8 9 10频数 4 3 18 22 3(3)简捷法:是加权法的另一种变形形式,主要用于连续型频数分布表。其公式为:组下限f:该组的频数其中: 身高 频 数1151

15、1183121812410127201301913312136413921421451总和80例10:80名上海市小学二年男生身高数据如下表:求其均值。(p16例2.2)解:5、变异系数o定义定义:同组数据的标准差与平均数的百分比。o含义含义:表示数据的相对变异程度相对变异程度,变异系数越小,变异程度就越小;变异系数越大,变异程度就越大。o适用条件: 比较单位相同但均数相差较大数据。 比较单位不同的数据。例11:测100名男生100米跑成绩 ;立定跳远 , ,是比较两项成绩哪一项整齐。解:所以:100米跑成绩更整齐。6、标准差(方差)与变异系数的区别o标准差反映数据的绝对绝对离散程度(变异程度

16、);变异系数反映数据相对相对的变异程度。o标准差(方差、全距)只能比较同质同质的数据;变异系数可以比较不同质不同质的数据。o变异系数只能比较大小,不能进行代数运算。例:上式无任何实际意义!上式无任何实际意义!集中趋势 离散趋势 应用场合算术均数 标准差 适用于对称分布,特别是正态分布 中位数 全距 变异系数 适用于任何分布资料,特别是偏态 分布、分布不明、分布末端无确定 值适用于均数相差悬殊或度量衡单位不同的资料各种样本特征数的适应条件本章重点内容o明确均数、中位数、标准差和变异系数的优缺点及其适用条件。o均数、中位数、标准差和变异系数的含义。o均数、中位数、标准差和变异系数的计算。o自由度:

17、自由度: 在统计学中,n个数据如不受任何条件的限制,则n个数据可取任意值,称为有n个自由度。若受到k个条件的限制,就只有(nk)个自由度了。 计算标准差时, n个变量值本身有n个自由度。但受到样本均数的限制,任何一个“离均差”均可以用另外的(n1)个“离均差”表示,所以只有(n1)个独立的“离均差”。因此只有(n1)个自由度。 返回身高频数累计频数 频率累计频率115111.25%1.25%118343.75%5.00 %12181210%15.00 %124102212.5%27.50 %127204225%52.5 %130196123.75%76.25 %133127315%91.25

18、%1364775%96.25 %1392792.50%98.75 %1421451801.25%100 %总和80 返回计算器用法 MODE MODE MODEMODE 1 “SD” 1 “SD” SHIFT CLR 1 EXE SHIFT CLR 1 EXE(= =) “ “清除数据清除数据” X1 M+ “X1 M+ “输输入数据入数据” X2 M+X2 M+ XnXn M+ M+ SHIFT 2 1 EXE(=) “ SHIFT 2 1 EXE(=) “算术平均算术平均数数” SHIFT 2 3 EXE(=) “SHIFT 2 3 EXE(=) “标准差标准差” MODE MODE MO

19、DEMODE 1 “SD” 1 “SD” SHIFT CLR 1 EXE SHIFT CLR 1 EXE(= =) “ “清除数据清除数据” 2.72 M+ “2.72 M+ “输输入数据入数据” 2.68 M+2.68 M+ 2.78 M+ 2.78 M+ 2.89 M+ 2.89 M+ SHIFT 2 1 EXE(=) “ SHIFT 2 1 EXE(=) “2.8362.836” SHIFT 2 3 EXE(=) “ SHIFT 2 3 EXE(=) “0.1470.147” MODE MODE MODEMODE 1 “SD” 1 “SD” SHIFT CLR 1 EXE SHIFT C

20、LR 1 EXE(= =) “ “清除数据清除数据” X1 SHIFT X1 SHIFT , f1 M+ “f1 M+ “输入数据输入数据” X2 SHIFT X2 SHIFT , f2 M+f2 M+ XnXn SHIFT SHIFT , fn M+fn M+ SHIFT 2 1 EXE(=) “ SHIFT 2 1 EXE(=) “算术平均数算术平均数” SHIFT 2 3 EXE(=) “SHIFT 2 3 EXE(=) “标准差标准差” 其中:其中: fnfn表示表示XnXn对应的频数。对应的频数。 MODE MODE MODEMODE 1 “SD” 1 “SD” SHIFT CLR

21、1 EXE SHIFT CLR 1 EXE(= =) “ “清除数据清除数据” 115 SHIFT 115 SHIFT , 1 M+1 M+ 118 SHIFT 118 SHIFT , 3 M+3 M+ 121 SHIFT 121 SHIFT , 8 M+8 M+ 142 SHIFT 142 SHIFT , 1 M+1 M+ SHIFT 2 1 EXE(=) SHIFT 2 1 EXE(=) “128.0875”“128.0875” SHIFT 2 3 EXE(=) “5.1685” SHIFT 2 3 EXE(=) “5.1685” 其中:其中: fnfn表示表示XnXn对应的频数。对应的频

22、数。 MODE MODE MODEMODE 1 “SD” 1 “SD” SHIFT CLR 1 EXE SHIFT CLR 1 EXE(= =) “ “清除数据清除数据” X1 SHIFT X1 SHIFT , f1 M+ “f1 M+ “输入数据输入数据” X2 SHIFT X2 SHIFT , f2 M+f2 M+ XnXn SHIFT SHIFT , fn M+fn M+ SHIFT 2 1 EXE(=) “ SHIFT 2 1 EXE(=) “算术平均数算术平均数” SHIFT 2 3 EXE(=) “SHIFT 2 3 EXE(=) “标准差标准差” 其中:其中: fnfn表示表示X

23、nXn对应的频数。对应的频数。 MODE MODE MODEMODE 1 “SD” 1 “SD” SHIFT CLR 1 EXE SHIFT CLR 1 EXE(= =) “ “清除数据清除数据” 5 SHIFT 5 SHIFT , 4 M+ “4 M+ “输入数据输入数据” 6 SHIFT 6 SHIFT , 3 M+3 M+ 10 SHIFT 10 SHIFT , 3 M+3 M+ SHIFT 2 1 EXE(=) “ SHIFT 2 1 EXE(=) “8.28.2” SHIFT 2 3 EXE(=) “ SHIFT 2 3 EXE(=) “1.281.28” 其中:其中: fnfn表示表示XnXn对应的频数。对应的频数。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号