《二章节统计描述》由会员分享,可在线阅读,更多相关《二章节统计描述(23页珍藏版)》请在金锄头文库上搜索。
1、第二章第二章 统计描述统计描述第二节第二节 正态分布正态分布正态分布(正态分布(Normal Distribution)概述:概述:正态分布是描述计量资料变量值正态分布是描述计量资料变量值分布的曲线,医学资料许多服从分布的曲线,医学资料许多服从正态分布。正态分布。 X值的频数分布与正态分布曲线值的频数分布与正态分布曲线(见图(见图2-4)图图2-4 频数分布与正态分布示意图频数分布与正态分布示意图一、正态分布的数学形式一、正态分布的数学形式分布曲线的密度函数方程分布曲线的密度函数方程X为连续随机变量,为连续随机变量,为为X值的总体均数,值的总体均数, 为总体标准差,记为为总体标准差,记为XN(
2、 , ) (- X )二、正态分布曲线理论上的特征二、正态分布曲线理论上的特征1以X= 为中心为中心,曲线下左右曲线下左右X值相等,且值相等,且对称性减少,呈钟型分布。对称性减少,呈钟型分布。2.在X= 处,处,f(X)为最大值(为最大值(x最多)最多)3. 、决定决定 正态分布曲线位置和形状正态分布曲线位置和形状=位置参数,位置参数,=形状参数,见图形状参数,见图2-5。说明:说明:1)1 2 ,x值的分布范围不同值的分布范围不同2) 1 2,xa,x的面积不同的面积不同3)正态分布是一个分布族)正态分布是一个分布族图图2-5 正态分布参数位置变化示意图正态分布参数位置变化示意图图图2-6
3、正态分布变异度不同变化示意图正态分布变异度不同变化示意图4.理论上,有中位数理论上,有中位数=均数(均数()5.任何正态分布通过任何正态分布通过u值值转换后转换后,称为称为标准化的正态分布,即标准化的正态分布,即u N( =0 , =1)标准正态分布方程标准正态分布方程三、正态曲线下面积(概率)的分三、正态曲线下面积(概率)的分布及估计方法布及估计方法1.曲线下曲线下a b区间面积的含义区间面积的含义1)表示)表示X值在值在a b区间占全部例数(区间占全部例数(X)的的百分比或表示百分比或表示X值在值在a b区间出现的区间出现的概率概率(P)。)。2)X在曲线下整个面积分布为在曲线下整个面积分
4、布为100%或或X值在曲线范围内出现的概率为值在曲线范围内出现的概率为1。2.估计曲线下面积的方法估计曲线下面积的方法1)对正态方程)对正态方程f(X)积分。积分。2)将变量值()将变量值(X)转换为转换为u值后,查值后,查标准正态分布表(标准正态分布表(P225),),可估计可估计任意任意a b区间的面积。区间的面积。标准正态分布曲线下面积表标准正态分布曲线下面积表(225页)为了应用的方便,将变量值(为了应用的方便,将变量值(X)做做u值转值转换,统计上对标准正态方程的变量(换,统计上对标准正态方程的变量(u)积积分,制定不同分,制定不同u值和对应的曲线的面积表值和对应的曲线的面积表(附表
5、(附表1),方便查询),方便查询。标准正态分布方程标准正态分布方程U=1.96,表示从表示从 到到1.96区间曲线区间曲线下的面积为下的面积为2.57%。U=1,表示从表示从 到到1区间曲线下的面区间曲线下的面积为积为15.87%。例:某地经大量调查得男童坐高例:某地经大量调查得男童坐高 ,S=2.08cm,估计总体中估计总体中坐高在坐高在65-70cm的人群比例。的人群比例。解:将解:将X1=65和和X2=70转换为转换为u值,查表值,查表用用在在65-70cm 的比例为的比例为29.67%+44.29%=73.96标准正态变量(标准正态变量(u)=0.8269表示从表示从u=到到u=0.8
6、269范围内的范围内的X比例为比例为20.61%。(u)=1.5769可表示可表示u=到到u=1.5769范围内比例为范围内比例为0.0571。变量值分布变量值分布的范围的范围X占全部变量值占全部变量值的百分比的百分比(%)68.27%95.00%99.00% 正态分布变量值正态分布变量值(X)理论上分布规律理论上分布规律3.医学常用的三个正态分布范围及界值医学常用的三个正态分布范围及界值统计中常用尾部面积的统计中常用尾部面积的u值,记值,记 ,称为分位数界,称为分位数界值。值。u0.05=1.96 (双侧)双侧) u0.01=2.58(双侧)双侧)u0.05=1.64 (单侧)单侧) u0.
7、01=2.33(单侧)单侧) 三、正态分布的应用三、正态分布的应用 1.估计估计X值一定比例的分布(值一定比例的分布(95%)范围:)范围:正态分布资料时正态分布资料时,实际工作中可用下列公式估实际工作中可用下列公式估计某临床指标的变量值分布范围计某临床指标的变量值分布范围:95%变量值分布范围变量值分布范围(双侧范围双侧范围).95%单侧分布范围单侧分布范围:95%单侧分布范围单侧分布范围:单单侧侧表表 例:例:102名名3岁以下儿童岁以下儿童LgA含量含量组段(组段(d) 频数频数 累计频数累计频数 位次范围位次范围 0- 29 29 1-2915- 32 61 30-61 30- 18
8、79 62-7945- 14 93 80-9360- 4 97 94-9775- 0 97 9790- 0 97 97105- 2 99 98-99120- 1 100 100135- 2 102 101-102合计合计 102例: 102名名3岁以下儿童岁以下儿童LgA含量含量该地该地3岁以下儿童岁以下儿童LgA含量的分布范围为含量的分布范围为1-135,由上式可见,该例不服从正态分布。,由上式可见,该例不服从正态分布。2.利用利用 估计变量值的范围或估计变量值的范围或对极端值做取舍。对极端值做取舍。3.利用利用u值转换估计值转换估计a-b区间理论上的频区间理论上的频数比例(例数比例(例2-13)。)。4.许多统计方法建立在正态分布基础上许多统计方法建立在正态分布基础上。正态分布要求正态分布要求本节要求:本节要求:1.正态分布理论上的正态分布理论上的4点特征点特征2.能正确使用标准正态分布表(利用能正确使用标准正态分布表(利用u值)值)3.熟悉正态分布的三个常用的分布规律。熟悉正态分布的三个常用的分布规律。