预防医学]04抽样误差与假设检验

资源描述

《预防医学]04抽样误差与假设检验》由会员分享，可在线阅读，更多相关《预防医学]04抽样误差与假设检验（46页珍藏版）》请在金锄头文库上搜索。

1、第四章抽样误差与假设检验,Sampling error & Hypothesis test,本章结构,均数的抽样误差与标准误 t分布总体均数的估计假设检验的意义和步骤,均数的抽样误差与标准误,Standard error,统计推断(statistical inference),inference,抽样误差的概念,定义：由抽样引起的样本统计量与总体参数间、以及样本统计量与样本统计量之间的差别。原因：个体变异随机抽样表现：样本统计量与总体参数间的差别不同样本统计量间的差别,假设一个已知总体，从该总体中抽样，对每个样本计算样本统计量(均数、方差等)，观察样本统计量的分布规律抽样分布规律

2、。考察：不同的分布不同的样本含量,抽样试验,从正态分布总体N（5.00,0.502）中，每次随机抽取样本含量n5，并计算其均数与标准差；重复抽取1000次，获得1000份样本；计算1000份样本的均数与标准差，并对1000份样本的均数作直方图。按上述方法再做样本含量n10、样本含量n30的抽样实验；比较计算结果。,抽样试验（n=5）,抽样试验（n=10）,抽样试验（n=30）,3个抽样实验结果图示,样本均数的抽样分布特点,各样本均数未必等于总体均数；样本均数之间存在差异；样本均数的分布很有规律，围绕着总体均数，中间多、两边少，左右基本对称，也服从正态分布；样本均数的变异较原变量的

3、变异大大缩小。随着样本含量的增加，样本均数的变异范围逐渐缩小。,标准误的概念(standard error),样本均数的标准差称为均数的标准误。均数的标准误表示样本均数的变异度。当总体标准差未知时，用样本方差代替，,标准误的概念,抽样的样本量越大，标准误就越小；原来总体变异度小，标准误就越小。标准误反映了样本均数间的离散程度，也反映了样本均数与总体均数之间的差异。当标准误大时，用样本均数对总体均数的估计的可靠程度就小；反之亦然。,标准差与标准误,意义：标准差用于描述个体值之间的变异，即观察值间的离散度，标准差小，表明观察值围绕均数的波动小；标准误描述统计量的抽样误差，即样本统计量与

4、总体参数的接近程度。标准误小，表明抽样误差小，则统计量稳定，与参数接近。用途：标准差表示观察值间波动的大小，用于医学参考值范围；标准误表示抽样误差的大小，用于参数估计。关系：随着样本含量增加，都减小。联系：都是表示变异度的指标，当样本量一定时，两者成正比。,中心极限定理(central limit theorem),中心极限定理(central limit theorem),t-分布,t-distribution,t 分布的概念,用样本方差代替总体方差，此时不再服从正态分布。而服从 t 分布。记为：,t分布曲线,t 分布有如下性质：单峰分布，曲线在t0 处最高，并以t0为中心左右对称

5、与正态分布相比，曲线最高处较矮，两尾部翘得高（见绿线）随自由度增大，曲线逐渐接近正态分布；分布的极限为标准正态分布。,t分布曲线下面积（附表2）,双侧t0.05/2，92.262 单侧t0.025，9 单侧t0.05，91.833 双侧t0.01/2，93.250 单侧t0.005，9 单侧t0.01，92.821 双侧t0.05/2，1.96 单侧t0.025，单侧t0.05， 1.64,总体均数的估计,Parameter estimation,总体均数估计方法,区间估计（interval estimation),也称置信区间。利用样本信息给出一个区间，并同时给出按预先给定的概率估计该

6、区间包含总体均数的可能范围。,可信度：给定的概率称为可信度。用表示。通常取99%、95%。,t分布方法,应用条件：总体方差未知，样本量小,例4.2 某医师侧的40名老年性慢性支气管炎病人尿中17-酮类固醇排出量均数为15.19umol/d，标准差为5.03umol/d，试估计该种病人尿17-酮类固醇排出量总体均数的95%可信区间。,分析条件：总体方差未知，样本量小,正态分布近似法,应用条件：当总体标准差已知时；或总体标准差未知，而样本量较大时（n50),例4.3 某市随机抽查12岁男孩100人，得身高均数139.6cm，标准差6.85cm。计算该地12岁男孩身高均数的95%的可信区间。,分析

7、条件：总体方差未知，但样本量大，用正态分布法,95可信区间：从总体中作随机抽样，作100次抽样，每个样本可算得一个可信区间，得100个可信区间，平均有95个可信区间包括(估计正确)，只有5个可信区间不包括(估计错误)。,可信区间的涵义,可信度实验,可信区间的两个基本要素,准确度：可信区间包含总体均数的概率。精密度：反映区间的长度。,假设检验,Hypothesis test,让我们先看一个例子.,例4.4 根据大量调查，已知健康成年男子的脉搏均数为72次/分。某医生在某山区随机调查30名健康男子，求得脉搏均数为74.2次/分，标准差为6.5次/分。能否认为该山区的成年男子的脉搏均数高于一般成年

8、男子的脉搏均数？,对差别的可能原因分析,山区男子脉搏的总体均数与一般成年男子的脉搏均数相等，差异是由抽样误差引起的提示山区男子是一般男子总体的一部分（研究总体）。山区男子脉搏的总体均数与一般成年男子的脉搏均数不相等，差异可能是由地域等因素引起的提示山区男子与一般男子是两个不同的总体。,假设检验通过对假设作出取舍抉择来达到解决问题的目的 A.山区男子脉搏的总体均数与一般成年男子的脉搏均数相等无差异假设、零假设 H0（null hypothesis） B.山区男子脉搏的总体均数与一般成年男子的脉搏均数不相等对立假设、备择假设H1（alternative hypothesis）,证明A还是证

9、明B？在H0成立的条件下，均数之间的差异是由抽样误差引起的，有规律可循；在H1成立的条件下，均数间的不同包含种种未知情形，无规律可循。故从H0成立的角度出发，寻求其成立的概率。,变量值（脉搏）X服从正态分布，且为小样本，假定H0成立，样本均数服从t-分布，则在H0成立的前提下，当前t值出现的概率有多大？,如何给出这个量的界限？,小概率事件在一次试验中基本上不会发生！,从附表2中查出在显著性水平=0.05（双侧），自由度为所对应的t界值，即为拒绝域与接受域的界限。如果计算出的t统计量大于相应的t界值，则落在拒绝域中，该统计量出现的概率小于5%，为小概率事件。,常取,的选择要根据实际情况

10、而定,通常取0.05,检验水准的概念,在假设检验中，称预先规定的小概率值为检验水准，也称为显著性水准，用表示。,这里所依据的逻辑是：,如果H0 是成立的，那么衡量差异大小的某个统计量落入区域拒绝域是个小概率事件。如果该统计量的实测值落入拒绝域，也就是说， H0 成立下的小概率事件发生了，那么就认为H0不可信而否定它。否则我们就不能否定H0 （只好接受它）.,1. 建立检验假设，确定检验水准； H0：零假设、无效假设。是与研究假设有关的、被推断特征某种确定的关系； H1：备择假设、对立假设。是被推断总体特征的另一种关系或状况，与H0既有联系又互相对立。检验水准，将小概率事件具体化，即规定概率不超过就是小概率。 2. 根据试验设计、资料类型、统计方法的条件选择检验方法，计算相应的统计量； 3. 确定P值，下结论。,假设检验的基本步骤：,P 值的概念,指从H0规定的总体中随机抽样抽得等于或大于（或等于或小于）现有样本统计量的概率。,本章总结,conclusion,

展开阅读全文

预防医学]04抽样误差与假设检验

最新文档