第四节 正态分布及标准误本次课要点:l1、熟悉正态分布、标准正态分布的概念;掌 握其主要特征及其应用;l2、掌握医学参考值的概念及其范围的制定方 法l3、了解均数标准误的意义及计算l4、掌握总体均数可信区间的概念及计算方法第四节 正态分布 (normal distribution)一、正态分布的概念1. 图形正态分布u=(X- )/ 标准正态分布高峰位于中央(均数所在处)、两侧逐渐降低且左右对称、不与横 轴相交的光滑曲线正态分布是一种重要的连续型分布①正态曲线(normal curve)在横轴上方均数处最高; ②正态分布以均数为中心,左右对称; ③正态分布有两个参数,即均数与标准差,常用 N(,)表示,用N(0,1)表示标准正态分布其位置与均 数有关,形状与标准差有关标准差大,离散程度大,正态 分布曲线则“胖”,反之,则“瘦”; ④正态分布的面积分布有一定的规律性二 正态分布分布曲线的特征三 正态曲线下面积的分布规律统计学家求出了标准正态分布从- 到(-u)的面积 实际工作中经常要用的面积分布规律有以下三点:三 正态曲线下面积的分布规律正态曲线下的面积规律-1.96+1.962.5%2.5%95%正态曲线下的面积规律-1.64+1.645%5%90%正态曲线下的面积规律-2.58+2.580.5%0.5%99%三、正态分布的应用1. 估计参考值范围; 2. 估计总体参数的可信区间; 3. 差异显著性检验; 4. 质量控制。
1、估计频数分布l出生体重低于2500g为低体重儿,某市婴儿出 生体重均数3200g,标准差为s=350g设该 资料服从正态分布,试求该地低体重儿占该地 所有出生婴儿的比例 计算:–首先计算标准离差:–查标准正态分布表: (-2)=0.0228–结果:估计低体重儿的比例为2.28%.参考值范围(reference interval)l参考值范围又称正常值范围(normal range)l什么是参考值范围:–是绝大多数正常人的某观察指标所在的范 围–绝大多数:90%,95%,99%等等l确定参考值范围的意义:–用于判断正常与异常l“正常人”的定义:–排除了影响所研究的指标的疾病和有关因 素的同质的人群参考值范围确定的原则l选定足够例数的同质的正常人作为研究对象 l控制检测误差l判断是否分组(性别,年龄组) l单、双侧问题 l选择百分界值(90%,95%) l确定可疑范围参考值范围的估计方法:正态分布法2.5%2.5%95%-1.96+1.96参考值范围的估计方法:百分位数法P2.5P97.595%参考值范围的估计方法方法双侧 单侧下限单侧上限正态分布法百分位数法 P2.5~P97.5 >P5 =tα,ν)= α 双侧:P(t =tα,ν)= α即:P(-tα,ν
–参数估计(parameter estimation)l点估计l区间估计–假设检验(hypothesis testing)参数估计之一:点估计l用样本统计量作为总体参数的估计例如:用样本均数作为总体均数的一个估计点估计的缺陷区间估计l可信区间的定义l总体均数之可信区间的求解l可信区间的要素l正确理解可信区间的含义区间估计【例4.1】 随机抽取某地25名正常成年男子, 测得该样本的脉搏均数为73.6次/分,标准差 为6.5次/分,估计正常成年男子脉搏总体均数 区间估计的实质l假设某个总体的均数为µ,需要找到两个量A 和B,使得在一个比较高的可信度下(如95%) ,区间(A,B)能包含µ即P(A<µ
【例4.2】 某市2001年120名7岁男童的身高 =123.62(cm),标准差s=4.75(cm),计算该市7 岁男童总体均数90%的可信区间可信区间的两个要素l可信度(Confidence):准确性,可靠性,即1 -α–一般取90%,95%,可人为控制l精确性(Precision):区间的大小,越小越好l必须二者兼顾95%可信区间的含义-2 -1 0 1 2按这种方法 构建的可信区 间,理论上平 均每100次,有 95次可以估计 到总体参数下列说法正确吗?算得某95%的可信区间,则:总体参数有95%的可能落在该区间有95%的总体参数在该区间内该区间包含95%的总体参数该区间有95%的可能包含总体参数该区间包含总体参数,可信度为95% 概念辨析l标准差标准误l个体变异 抽样误差l参考值范围 可信区间l变量分布 抽样分布作业:l简述标准差和标准误的区别和联系l简述参考值范围与均数的可信区间的区别和联 系谢谢再见。