样本含量估计ppt课件

上传人:工**** 文档编号:569862589 上传时间:2024-07-31 格式:PPT 页数:46 大小:3.64MB
返回 下载 相关 举报
样本含量估计ppt课件_第1页
第1页 / 共46页
样本含量估计ppt课件_第2页
第2页 / 共46页
样本含量估计ppt课件_第3页
第3页 / 共46页
样本含量估计ppt课件_第4页
第4页 / 共46页
样本含量估计ppt课件_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《样本含量估计ppt课件》由会员分享,可在线阅读,更多相关《样本含量估计ppt课件(46页珍藏版)》请在金锄头文库上搜索。

1、第五章总体和样本第五章总体和样本 第三节样本含量估计第三节样本含量估计第一节基本概念第二节抽样过程及方法1第三节 样本含量估计 样本含量估计的目的确定样本量的方法样本含量估计的注意事项2 按照总体客观存在的性质与特征和研究者所欲承担的误差风险而决定的最小样本量。 样本含量过小样本含量过小 指标不稳定指标不稳定 检验效能低检验效能低 样本含量过大样本含量过大 增加研究困难增加研究困难 难于控制条件难于控制条件 浪费人力物力浪费人力物力样本含量(样本含量(sample size)3估计样本含量的目的估计样本含量的目的v在保证某项研究/临床试验的结论具有一定科学性、真实性和可靠性前提下,确定某研究所

2、需的最小观察例数。4确定样本量的方法确定样本量的方法 v经验法经验法v查表法查表法v计算法计算法v计算机计算机软件协助软件协助 5确定样本量的方法确定样本量的方法-经验法经验法v计量资料:30-40例v计数资料:50-100例v调查研究在100以上:地区性研究:平均样本人数5001000人;全国性研究:15002500人描述性研究:样本最少占总体的10,如果总体较小,则最少占总体20相关性研究:受试者至少30人以上6确定样本量的方法确定样本量的方法-计算法和查表计算法和查表法法1-和和TEXT 检检 验验水水准准检检验验效效能能总总总总 体体体体标率标率准准差差容容许许误误差差v样本含量估计常

3、用的两种方法。v需要提前确定以下参数:7 即假设检验第一类错误出现的概率,也称假阳性率,,即检验水准或显著性。越小,所需的样本量越大,反之就要越小。水平由研究者根据具体情况决定,通常取0.05或0.01。v另外还应明确是单侧或双侧检验。用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大;当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时,其或的U界值通过查标准正态分布的分位数表可得。 检验水准(检验水准(a值)值)8 又称把握度,为1-,即在特定的水准下,若总体参数之间确实存在着差别,此时该次实

4、验能发现此差别的概率。即假设检验第二类错误出现的概率,为假阴性错误出现的概率。检验效能即避免假阴性的能力,越小,检验效能越高,所需的样本量越大,反之就要越小。水平由研究者具情决定,通常取为0.2,0.1或0.05。即1=0.8,0.9或0.95,也就是说把握度为80%,90%或95%。 检验效能(检验效能(1-1-)9组间出现统计学上显著性差异组间存在的真实差异有无有正确(1-)I类错误()无II类错误()正确(1-)临床试验计数资料结局根据假设检验可能出现的结果I类错误的概率:单侧为,双侧为/2,越小所需样本越大,一般取0.05;检验效能:1-,为II类错误,一般=0.1或=0.2,越大,检

5、验效能越低,样本数量也越小;10总体标准差反映计量资料总体中各观察单位计量值的变异程度。如:计量(定量)指标血压、血糖、血清酶等。总体率反映计数资料总体率的变异程度。如:计数(定性)指标死亡与存活,阳性与阴性,正常与异常等。通过以往的实验得出的经验或查阅文献资料作出估计。如无依据,可从研究者所作的预备实验结果中获取的样本的标准差s或样本率P分别作为和的估计值。在其他条件相同的情况下,越大,越接近0.5,所需样本含量越大。总体标准差总体标准差和总体率和总体率11即预计样本统计量和相应总体参数的最大相应误差控制在即预计样本统计量和相应总体参数的最大相应误差控制在什么范围。即本研究有研究意义或临床实

6、际意义的最小差什么范围。即本研究有研究意义或临床实际意义的最小差值。计量资料,值。计量资料,为两均数差值或实验前后差值。计数资为两均数差值或实验前后差值。计数资料,料,为具有实际临床意义的有效率或患病率等差值。其为具有实际临床意义的有效率或患病率等差值。其他条件确定的情况下,他条件确定的情况下,越小,所需样本含量越大。越小,所需样本含量越大。 容许误差容许误差12确定样本量的方法确定样本量的方法-计算法 v通通过过数数学学公公式式估估算算出出所所需需样样本本含含量量。其计算公式往往是根据检验统计量的公式反推过来求样本含量。v研研究究的的性性质质不不同同、研研究究的的科科研研设设计计不不同同、抽

7、抽样样方方法法不不同同,估估计计样样本本量量的的计计算算公公式式也也不不同。同。v不不同同的的检检验验方方法法都都有有确确定定样样本本含含量量的的方方法法计计算公式。算公式。131.11.1估估计总体均数体均数所需样本含量公式所需样本含量公式v为总体标准差,一般用样本标准差s表示;为容许误差,即样本均数与总体均数间的容许差值;取双侧,u值可以查表。1. 单纯随机抽样样本含量的估计单纯随机抽样样本含量的估计14v例1:某医院拟用抽样调查评价本地区健康成人白细胞数的水平,要求误差不超过0.2*109/L。根据文献报告,健康成人的白细胞数的标准差约1.5*109/L。问需要调查多少人?(双侧=0.0

8、5) u/2=1.96(查界值表所得) =1.5 =0.2n=(1.96)n=(1.96)2 2(1.5)(1.5)2 2/(0.2)/(0.2)2 2=216.1=216.1217217单侧0.400.300.200.100.050.0250.010.005双侧/20.800.600.400.200.100.050.020.01u值0.25320.52430.84171.28161.64491.9602.32632.57581.1估计总体均数所需样本含量估计总体均数所需样本含量151.2 估计总体率所需样本含量公式vP P为总体率为总体率的估计值的估计值,若,若同时有几个估计值供参考,应取同

9、时有几个估计值供参考,应取最接近最接近0.50.5者;若对总体一无所知,亦可设者;若对总体一无所知,亦可设=0.5=0.5。因为此时。因为此时(1-1-)=0.5=0.52 2=0.25=0.25为最大,以免样本量为最大,以免样本量n n过小。过小。为允许为允许误差,即允许样本率和总体率的最大容许误差为多少。误差,即允许样本率和总体率的最大容许误差为多少。取取双侧,双侧,u u值可以查表值可以查表。1. 单纯随机抽样样本含量的估计单纯随机抽样样本含量的估计率率16例2:某口腔医院研究青少年龋齿发病情况,拟了解某市青少年龋齿患病情况,期望误差在平均患龋齿率30%的1/6范围内,当双侧=0.05,

10、问需要抽样调查多少人?1 1.2 .2 估估计总体率体率所需样本含量所需样本含量ua/2=u0.05/2=1.96 p=0.3 =0.3/6=0.05n=(1.96)2(0.30)(1-0.30)/(0.05)2=322.7323单侧0.400.300.200.100.050.0250.010.005双侧/20.800.600.400.200.100.050.020.01u值0.25320.52430.84171.28161.64491.9602.32632.5758172.实验研究设计样本含量估计实验研究设计样本含量估计2.1 2.1 样本均数与本均数与总体均数比体均数比较(或配对设计均数比

11、较)公式(或配对设计均数比较)公式n 为所需样本含量,如为配对设计时为所需样本含量,如为配对设计时n为对子数。为对子数。ua是检验水准是检验水准a所对应的所对应的u值,查表可得。值,查表可得。u是第二类错误的概率是第二类错误的概率相对应相对应u值,查表可得。值,查表可得。=1-0为研究者提出的差值,为研究者提出的差值,0为已知的总体均数,为已知的总体均数,1为估计实验结果的总体均数。为估计实验结果的总体均数。用样本标准差用样本标准差s代替。代替。182.1.1 样本均数与总体均数比较例3:已知某地成年男性的血红蛋白含量(13515)g/L,拟在当地煤矿工人中对成年男性进行抽样调查,研究煤矿工人

12、的血红蛋白量水平与当地一般成年男性无差异。根据专业医学知识,当血红蛋白含量相差10g/L以内时,认为二者无差异。取双侧=0.05,=0.10,问应检查多少煤矿工人? 单侧0.400.300.200.100.050.0250.010.005双侧/20.800.600.400.200.100.050.020.010.400.300.200.100.050.0250.010.0051-0.600.700.800.900.950.9750.990.995u值0.25320.52430.84171.28161.64491.9602.32632.5758ua/2=1.96 u= 1.2816 = 15 =

13、 10 n=(1.96+1.2816)2(15)2/(10)2=23.62419例4:某院普查市区2-6岁幼儿体格发育情况,其中体重未达标的幼儿,血红蛋白平均为100g/L,标准差25g/L。现欲使用抗贫血药物,如果治疗前后血红蛋白上升10g/L为有效。设单侧=0.05,=0.1时,试问应治疗多少人可以认为该药是有效的?单侧0.400.300.200.100.050.0250.010.005双侧/20.800.600.400.200.100.050.020.010.400.300.200.100.050.0250.010.0051-0.600.700.800.900.950.9750.990.

14、995u值0.25320.52430.84171.28161.64491.9602.32632.5758 ua=1.6449 u= 1.2816 = 25 = 10 n=(1.6449+1.2816)2(25)2/(10)2=54.9552.1.2 配对设计均数比较配对设计均数比较202.2.2 2 两样本均数比较两样本均数比较 试验组样本量为试验组样本量为n n,对照组样本含量为,对照组样本含量为knkn,当两组样本含量相等时,当两组样本含量相等时,k=1k=1。2.32.3多样本均数比较多样本均数比较2.实验研究设计样本含量估计实验研究设计样本含量估计21v2.4.1 样本率与总体率比较

15、例6:某医师研究药物对产后宫缩、外阴创伤的镇痛效果,公认稳定有效的老药物镇痛有效率55%,若新药镇痛有效率达75%,可说明新药优于标准药物,需治疗多少例数?(设=0.05,=0.20)v查表u0.05=1.6449, u0.2=0.8417v为容许的误差,即允许样本率和已知总体率的最大容许误差。=0.75-0.55=0.2v为已知总体率。=0.552.42.4定性资料的样本含量估计定性资料的样本含量估计定性资料的样本含量估计定性资料的样本含量估计 n=(1.6449+0.8417)20.55(1-0.55)/(0.2)2=38.339率率22v2.4.2 两样样本率比较 2.42.4定性资料的

16、样本含量估计定性资料的样本含量估计定性资料的样本含量估计定性资料的样本含量估计率率v此公式计算得到的样本量N为单样本量。试验组需要样本量为n时,对照组需要样本含量为kn。当两组样本含量相等时,k=1。v式中pe、pc分别代表两组样本率,p代表两组的合并率。当两组样本含量相等时,k=1,p=(pe+pc)/2。 23v例7:初步观察甲、乙两药治疗湿疹的疗效,得甲药有效率60%,乙药有效率为85%,现拟进一步作治疗实验,设双侧=0.05,=0.1,两样本例数相等时,需要观察多少例能说明乙药效果优于甲药?v查表u0.05/2=1.96, u0.1=1.282v两样本例数相等k=1vpe=0.85,p

17、c=0.6,p=(pe+pc)/2=(0.85+0.6)/2=0.725vpe-pc=0.85-0.6=0.252.42.4.2 .2 两样本率比较两样本率比较n1=n2=2(1.96+1.282)20.725(1-0.725)/0.25=67.16824确定样本量的方法确定样本量的方法-查表法v按照研究条件直接查样本含量表来获得样本含量。v样本含量表是统计学家为方便应用,根据特定公式按不同检验水准,检验效能1-等条件编制的数据表。v研究目的不同,资料性质不同,估计方法不同,样本含量表也不同。25v例1:某医院拟用抽样调查评价本地区健康成人白细胞数的水平,要求误差不超过0.2*109/L。根据

18、文献报告,健康成人的白细胞数的标准差约1.5*109/L。问需要调查多少人?v(双侧=0.05) 估计总体均数所需样本含量估计总体均数所需样本含量26=1.5 =0.2/ =1.5/0.2=7.5确定样本量的方法-查表法查表法公式计算法:u/2=1.96 n=(1.96)n=(1.96)2 2(1.5)(1.5)2 2/(0.2)/(0.2)2 2=216.1=216.121721727样本均数与总体均数比较例例3 3:已知某地成年男性的血红蛋白含量:已知某地成年男性的血红蛋白含量(135(13515)g/L15)g/L,拟在当地煤矿工人中对,拟在当地煤矿工人中对成年男性进行抽样调查,研究煤矿

19、工人的血红蛋白量水平与当地一般成年男成年男性进行抽样调查,研究煤矿工人的血红蛋白量水平与当地一般成年男性无差异。根据专业医学知识,当血红蛋白含量相差性无差异。根据专业医学知识,当血红蛋白含量相差10g/L10g/L以内时,认为二者以内时,认为二者无差异。取双侧无差异。取双侧 =0.05=0.05, =0.10=0.10,问应检查多少煤矿工人,问应检查多少煤矿工人? ? ua/2=1.96 u= 1.2816 n=(1.96+1.2816)2(15)2/(10)2=23.624= 15 = 10/=10/15=0.6728例4:某院普查市区2-6岁幼儿体格发育情况,其中体重未达标的幼儿,血红蛋白

20、平均为100g/L,标准差25g/L。现欲使用抗贫血药物,如果治疗前后血红蛋白上升10g/L为有效。设单侧=0.05,=0.1时,试问应治疗多少人可以认为该药是有效的? 配对设计均数比较配对设计均数比较= 25 = 10/=10/25=0.4 ua=1.6449 u= 1.2816 n=(1.6449+1.2816)2(25)2/(10)2=54.95529v例7:初步观察甲、乙两药治疗湿疹的疗效,得甲药有效率60%,乙药有效率为85%,现拟进一步作治疗实验,设双侧=0.05,=0.1,两样本例数相等时,需要观察多少例能说明乙药效果优于甲药? 两样本率比较两样本率比较pe=85%,pc=60%

21、,=pe-pc=85%-60%=25% 若两样本率有小于50%者,取较小的样本率作为较小率;若两样本率均大于50%,则计算1-p,用1-pe、1-pc中较小者为较小率查表。pe=85%,pc=60%, 1-pe=15%,1-pc=40%n1=n2=2(1.96+1.282)20.725(1-0.725)/0.25=67.16830确定样本量的方法-查表法查表法31vPASS(Power analysPower analysi is s and sample size, and sample size,网址为:http/)vSAS统计软件确定样本量的方法确定样本量的方法-计算机软件32样本含量估

22、计的注意事项1 1、选择恰当的、选择恰当的估算样本含量的方法。估算样本含量的方法。2 2、尽量、尽量选择的总体单一,减少个体变异;尽量选择选择的总体单一,减少个体变异;尽量选择客观指标;选择较优实验设计方案,严格控制实客观指标;选择较优实验设计方案,严格控制实验条件;验条件;成组设计的例数,应尽可能采用例数相成组设计的例数,应尽可能采用例数相等的设计,尤其是多组设计时,一般要求各组间等的设计,尤其是多组设计时,一般要求各组间的样本含量相等。的样本含量相等。333 3、多种样本含量估计方法相结合。、多种样本含量估计方法相结合。若某研究有多个若某研究有多个效应指标,其样本含量估计应对每个效应指标进

23、效应指标,其样本含量估计应对每个效应指标进行样本量的估计,然后取样本数量最大者为其研行样本量的估计,然后取样本数量最大者为其研究的样本量。若某研究能区分主要指标和次要指究的样本量。若某研究能区分主要指标和次要指标时,也可以只对主要指标进行样本含量估计,标时,也可以只对主要指标进行样本含量估计,然后取量大者为其研究的样本含量。然后取量大者为其研究的样本含量。样本含量估计的注意事项样本含量估计的注意事项344 4、由于估算的样本含量是最少需要量,考虑、由于估算的样本含量是最少需要量,考虑到受试者可能有不合作者、中途失访、意到受试者可能有不合作者、中途失访、意外死亡等情况出现,而减少有效观察对象外死

24、亡等情况出现,而减少有效观察对象的例数(失访),因此,估算的样本含量的例数(失访),因此,估算的样本含量必须考虑样本的丢失情况,进行实验时需必须考虑样本的丢失情况,进行实验时需增加增加10101515的样本量。的样本量。样本含量估计的注意事项样本含量估计的注意事项35v吴胜贤吴胜贤, ,王成祥王成祥. .临床研究样本含量估算临床研究样本含量估算MM. .北京:北京:人民卫生出版社人民卫生出版社v孙振球孙振球, ,徐勇勇徐勇勇. .医学统计学第医学统计学第3 3版版MM. .北京:北京:人民卫生出版社人民卫生出版社参考文献参考文献36第六章第六章 收集资料的方法收集资料的方法37本章学习内容v第

25、一节第一节 收集资料前的准备收集资料前的准备v第二节第二节 自陈法自陈法v第三节第三节 观察法观察法v第四节第四节 生物学测量法及其他方法生物学测量法及其他方法38第一节第一节 收集资料前的准备收集资料前的准备一、资料的定义v资料收集:资料收集:是指收集研究问题相关信息和测量研究变量的过程,是一个系统的有计划的过程。v资料:资料:课题研究过程中的全部资料,包括反映课题研究基本情况的资料。(广义)v科研资料:科研资料:根据研究目标,用系统的方式所收集、储存和处理的信息,它最终用以回答研究问题,也是研究产生的过程性资料。(狭义)39v资料的种类(根据资料的属性)第一节第一节 收集资料前的准备收集资

26、料前的准备资料资料质性质性量性量性文字、图像声音、录像1、2、3 5、6.40第一节第一节 收集资料前的准备收集资料前的准备v资料的来源一手资料:研究者根据研究目的和研究计划,通过使用不同资料收集方法所收集的资料,包括对研究对象进行调查、观察、访谈等方式收集的资料。二手资料:在其他课题的现有资料的基础上进行二次分析,得出新的研究结论。41第一节第一节 收集资料前的准备收集资料前的准备v常用的收集资料的方法问卷法访谈法观察法生物医学测量法德费尔法自陈法结构式、半结构式或者非结构式42第一节 收集资料前的准备v设计收集资料方案前应考虑的问题 1.1.研究目的研究目的 2.2.研究设计复杂性研究设计

27、复杂性 3.3.研究可利用的资源研究可利用的资源 4.4.研究对象特点研究对象特点 5.5.是否存在霍桑效应是否存在霍桑效应43 1 1. .研究目的:研究目的:明确研究的明确研究的问题和目的是决定收集和目的是决定收集资料方料方 法的关法的关键因素。研究目的决定了所需因素。研究目的决定了所需资料料 的性的性质。 研究目的:通研究目的:通过自我自我认识、自我情感体、自我情感体验、自我控制和、自我控制和调节,分分析析5 5岁、6 6岁幼儿的自我意幼儿的自我意识发展水平。展水平。 方法:方法:运用运用问卷法及卷法及观察法察法筛选社会退社会退缩行行为幼儿幼儿,探探查幼儿的幼儿的自我意自我意识发展与其社

28、会退展与其社会退缩行行为的关系。的关系。设计收集资料方案前应考虑的问题设计收集资料方案前应考虑的问题5 5岁岁6 6岁幼儿社会退缩行为与自我意识关系的研究岁幼儿社会退缩行为与自我意识关系的研究 445.5.是否存在霍桑效应是否存在霍桑效应 霍桑效霍桑效应是指研究是指研究对象若意象若意识到他到他们正在参与研究,正在参与研究,则或多或少地改或多或少地改变自己的行自己的行为和反和反应状状态。 摘要:在某院运摘要:在某院运动训练专业篮球球专选课上,运用心理学中的上,运用心理学中的“霍桑效霍桑效 应”进行行为期期5个月的投个月的投篮教学教学训练的的对比比实验研究。研究。结果表果表 明:明:实验组和和对照照组的投的投篮命中率都有所增命中率都有所增长,但,但实验组的的 增幅增幅显著高于著高于对照照组,说明运用明运用“霍桑效霍桑效应”在投在投篮教学教学训练 中有非常中有非常显著的作用。著的作用。 - “霍桑效应霍桑效应 对投篮教学训练效果的实验研究对投篮教学训练效果的实验研究设计收集资料方案前应考虑的问题设计收集资料方案前应考虑的问题4546

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号