第四章正态分布体育统计学要点

上传人:ni****g 文档编号:489496585 上传时间:2023-04-25 格式:DOC 页数:16 大小:623.50KB
返回 下载 相关 举报
第四章正态分布体育统计学要点_第1页
第1页 / 共16页
第四章正态分布体育统计学要点_第2页
第2页 / 共16页
第四章正态分布体育统计学要点_第3页
第3页 / 共16页
第四章正态分布体育统计学要点_第4页
第4页 / 共16页
第四章正态分布体育统计学要点_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《第四章正态分布体育统计学要点》由会员分享,可在线阅读,更多相关《第四章正态分布体育统计学要点(16页珍藏版)》请在金锄头文库上搜索。

1、第四章 正态分布如果将第二章中的(表2 1)中的数据绘制成直方图,把每个方条顶部中点联结起来,就得到一个图形,它称为频数多边形。(图4 1)当分组数很多,组距很小时,频数多边形就趋于类似(图4 2)所示的平滑的曲线。这种曲线呈现出两侧近似对称的钟形。随机 变量的类似这种分布,在自然界是相当普遍的其中最有代表性的是正 态分布。下面就来介绍正态分布及其在体育中的几个应用。图4 1频数多边形图#第一节正态分布曲线的形式如果随机变量X的概率密度函数为y=二;占)(4 1)则称随机变量X是服从正态分布的由上式绘出的图形叫做正态曲线 (图4 2) X的变动范围在至+:间。#正态分布曲线中有两个参数:均值

2、J及方差二2。为了应用方便,对式(4 1)中的随机变量经过一个称为标准化的变换,即令x 卩u来代替原式中的 x,寻这时的随机变量u的概率密度函数成为:y = 2【e送(4 2)#按照(4 2)式绘出的图形,称作标准正态曲线。(图4 3)#图4 3标准正态分布曲线第二节正态分布曲线的特征正态分布曲线有许多特点,它们对实际工作有很大的帮助。它的 主要特点有以下几个方面:一,正态分布的形式是对称的(但对称的分布不一定是正态分 布)。在正态分布中均值与中位数相重合。二,从中央最高点逐渐向两侧降低,降低的速度是先慢后快,以 后又再次减慢,最后接近横轴,但终究不能与横轴相交。三,从中央向两侧逐渐下降,它的

3、方向是先向内弯,达到离均值 左右各一个标准差时又改向外弯,是以一仁 的点为曲线从内弯转向外弯的转折点,即正态曲线中标准差与曲线有固定的关系。四,因为正态曲线是对称的,在曲线下不仅平均数的两侧面积相 等,各相当距离间的面积相等,而且各相当距离间的曲线高度也相等, 正态曲线下(与横轴间)的总面积为 1.00。五,正态曲线可以有不同形式,它们的均值和标准差可以不相同, 均值不同表明曲线在横轴上所处位置不同, 标准差不同表明曲线的形 态不同。标准差小则曲线高、且窄;标准差大则曲线低、且宽。(图4 4)由式(4 1)和(4 2)知,标准正态曲线的=0,二= 1,即标准正态曲线是关于纵轴对称;它在 J =

4、 0时,有最大值, 它近似等于0. 4,如(图4 3)所示。#丫八a =2图4 4三种不同形式的正态分布曲线第三节正态分布表从某市17岁男生中随机抽出205人测量身高,由这个样本计算 得到X = 168. 40厘米,S = 6. 13厘米。假定该市17岁男生身高服从 正态分布,试估计身高在16. 40 172. 40厘米之间的人数。求解这类问题的一般方法是:求从正态总体中随机选取一个个体 的测量值落在区间(a, b)上的概率。这个概率在标准正态曲线下就 是曲线、X轴、直线X = a和X b所围成的面积。(图4 5)当 概率P求得后,要求的人数约等于总人数乘以 P值。0.4图4 5随机变量X在区

5、间(a, b)内取值的概率示意图表的左边第1列这横轴上的位置,它是指横轴上某一点与平均 值的距离,以标准差为单位来表示,通常记为 u,即#表上边的第1行为u值的第2位小数。表的主体部分是各 u值与均 数(u二0)之间所对应的单侧面积(或概率)。一、知U值求对应的面积例4 1 求u值为一1至+2之间对应的面积。解:由于标准正态曲线是关于 x = u对称的均数处的u值为零, 所以u值在一 1至0这间对应的面积与它在 0至+1之间的对应面 积相等。查书后附表1得u值在1至0的对应面积是34. 13%; u 值在0至+2之间的面积是47. 72%。前者在均值的左边,后者在均 值的右边,因此这两块面积之

6、和便是所求面积。(图4 6)即:34. 13% + 47. 72% = 81.85%-1 0 2图4 6例4 2本节开始提出的问题,即试估计身咼在160. 40 172. 40厘米之间的人数。解:首先要求出身高为160. 40厘米和172. 40厘米的u值,按式 (4 3)有(当u和二未知时,可用 X和S近似代替):Ui160.40 - 168.401. 31U26.13172.40 -168.406.13=0. 65查书后附表1求uU2所对应的面积。U1 = 1. 31所对应的面积是 40. 49%, U2 = 0. 65 所对应的面积是 24. 22%。u 值1. 31 至 0. 65 所

7、对应的面积为40. 49% + 24. 22% = 64. 71%,见(图4 7)所示, 于是身高在160. 40 172. 40厘米之间的人数约为 205 X 64. 71%133 (人)。160.40 米172.40 米图4 7 估计身高在160. 40-172. 40厘米间的人数百分数二、已知面积求对应的 U值例4 3 试求从+1二向右到什么位置对应的面积为14. 15%?解:设从+1匚向右到+k二对应的面积为14. 15%。查标准正态分布表知+1二对应的面积是34. 13%。24. 13%+14. 15% = 48. 28%,就是u值从0到+k之间对应的面积。查书后附表1和K = 2.

8、 11 , 即从+仁 向右到+2. 1仁 之间对应的面积为14. 15%。(图4 8) 从标准正态分布表中,可以找出标准正态曲线下面的分布规律。在下表中列出的五个分布位置与其对应的概率是统计中电子学用到 的,应该熟记。a +16 +2.116图4 8 从+1? +2. 1仆对应的面积表41正态曲线下的概率分布-U-该范围具有的概率1 _仁68. 26%-1.96;:95. 00%_2 ;95. 44%1 -2. 58;:99. 00%1 _3 -99. 73%第四节 统计资料的正态性检验正态分布的理论适用于正态或近似正态分布的资料。 对样本要想 用正态分布理论进行分析,首先要检验样本是否为正态

9、分布。检验的 方法有多种,简单而实用的方法是“概率格纸绘图法”。这种方法使 用的概率纸是正态概率纸,它的横轴是普通的刻度,纵轴是按正态分 布的规律刻划的。使用时,先根据样本数据求出累计频率,然后根据 累计频率和组限,将其点绘在正态概率纸上,如果样本资料是呈正态 分布的则所有点几乎在一条直线上。例4 4 广州市某中学初中生800米跑的抽样测验成绩的累 计频率如下表所示,试检验该资料是否近似正态分布?组限频数累计频数累计频率(%)2 37 -110. 82 44 -675. 62 51 -152217. 62 58 -204233. 63 05 -276955. 23 12 -259475. 23

10、 19 -2111592. 03 26 -612196. 83 33 -212398. 43 40 -2125100. 0由样本计算得:X 二 3 03 2,S = 12 4然后根据每组的下限值和相应的累计频率,将它们分别标在图上。根 据点的分布趋势画一直线,观察这些点的分布是否接近一条直线。 在 画直线时应以靠近中部的点为主, 两端的点为辅,因为中部的点的组 频数大,所以占比重也大。由(图 4 9)可见,所有的点几乎都在 一条直线上,故该样本资料接近于正态分布。15.87图 4 9当样本资料符合正态分布时,籍助正态概率纸做图,还可以对J 和二作出近似地估计。从正态分布理论知道累积频率为50%

11、的位置应在中点,即接近均数位置。从纵轴 50%的位置画横线与钭线交 于a点,由不得a点向横轴做垂线交于点,其值为3 02 8, 即为估计均数,它与计算值3 02 2仅相差0“5。又知均数减一个标 准差位置的面积为34. 13%,故在纵轴上的应是50% 34. 13% = 15. 87% (b点),以此划横线交于钭线上c点,向横灿做垂线交于 2 50 9 处,此点距均数的长度应为二,故估计标准差的值为: 3 02 8-2 50 9 = 11 9。计算值为12 4,仅相差0 5。只要图做得 准确,这些估计值也还是比较精确的第五节可疑数据的舍取在实际工作中,往往能够发现样本资料中具有个别突出的数值(

12、特大或特小的数值)。按样本数据系列大小顺序来看,发现这些突 出的数值和其他数值之间有明显脱节现象。 这种现象使人们怀疑这些 特别数值是否属于研究的总体,于是把这些数据称为可疑数据。 人们 把来自非同一总体的极端值,称为异常数据。样本中的异常数据应当 及时剔除,否则会影响样本均数和标准差等统计量及计算结果的准确 性。如何判断可疑数据是否为异常数据,方法不少,下面介绍适用于 正态分布,且数据个数不多时,比较常用而有效的戈罗伯斯(Grubbs) 检验法。设Xi,X2,x n来自正态分布的总体,将它们按大小重新排列,记为 X(i)WX(2)W WX(n)。首先计算出可疑数据的g n值,其公式为:(4

13、4)|x -x|s式中X,表示可疑数据值,若计算得 g n值大于(表4 2)中的临 界值an,则认为X,是异常数据,应舍弃。若小于临界值,则X,为 正常数据,应保留。表4 2 戈罗伯斯检验临界值(环)表=0. 05nannanannchnCn31. 15122. 29212. 58302. 96402. 8741.46132. 33222. 60313. 03502. 9651.67142. 37232. 62323. 09603. 0361. 82152. 41242. 64333. 14703. 0971. 94162. 44252. 64343. 18803. 14#82.03172.

14、47262. 75353. 21903. 1892.11182. 50272. 82363. 231003. 21102.18192. 53282. 87373. 241103. 23112.23202. 56292. 92383. 251203. 24例4 5到统计量如下:为了解一般高中学生跳高水平,由随机样本计算得n 二 100 人X = 1. 31 米s = 0. 09 米假定这些学生跳高成绩的分布呈正态分布。 其中有一名学生的成绩是1. 65米,这个成绩超出平均水平三个标准差以上,是个可疑数据。 试检验它是否为异常数据。按公式(44)计算|x*X|1.65-1.31|exg n =3. 78s0.09查(表4 2)n = 100对应的an值是

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号