《实验设计(样本的含量估计)》由会员分享,可在线阅读,更多相关《实验设计(样本的含量估计)(23页珍藏版)》请在金锄头文库上搜索。
1、卫生统计学卫生统计学(第五版)(第五版)卫生统计学与数学学教研室卫生统计学与数学学教研室总体和样本总体总体样本样本基于样本资料基于样本资料的推论的推论对总体规律的推断例:所有高胆固醇患者例:在一个临床试验中 150例高胆固醇患者例:试验药物治疗 降低了胆固醇第四节第四节 样本含量的估计样本含量的估计 样本含量的估计原则是指在研究结论具有是指在研究结论具有一定可靠性(精确度和检验效能)的基础上确一定可靠性(精确度和检验效能)的基础上确定最少的样本例数。定最少的样本例数。 样本含量样本含量即观察即观察例数的多少,又称样本大小。随着试验设计的类型不同其样本含量估计的随着试验设计的类型不同其样本含量估
2、计的方法也不同方法也不同 所所以以,在在医医学学科科研研中中,必必须须根根据据资资料料的的性性质质,借借助助适适当当的的公公式式,进进行行样样本本含含量量的的估估计。计。 一、样本含量估计的意义一、样本含量估计的意义 样本含量过小,所得指标不稳定,用以推断总体的精密度和准确度差。使检验效能偏低,出现假阴性的结果。 样本含量过大,导致人力、物力和时间上的浪费。常引入更多的混杂因素,对研究结果造成不良影响。(一)检验水准:(一)检验水准:(二)检验效能:(二)检验效能:1-1-(三)总体变异度:(三)总体变异度:或或(四)容许误差:(四)容许误差:=1 1-2 2或或=1 1-2 2二、影响样本含
3、量估计的因素二、影响样本含量估计的因素 影响假设检验时样本含量估计的因素有四个: 越越小小,所所需需样样本本含含量量越越多多。一一般般取取 ,并并可可根根据据专专业要求决定取单侧业要求决定取单侧或双侧或双侧。(一)检验水准(一)检验水准第一类错误的概率第一类错误的概率 ,即检验水准。,即检验水准。(二)检验效能(二)检验效能1-1-检验效能检验效能1 1 或或第二类错误概率的大小第二类错误概率的大小 。1 1 越大,所需样本含量越多越大,所需样本含量越多, ,第二类错误的概率愈第二类错误的概率愈小。通常取小。通常取 或或 ,一般,一般1 1 不能低于。不能低于。(三)总体变异度(三)总体变异度
4、或或(四)容许误差(四)容许误差=1 1-2 2或或=1 1-2 2总总体体标标准准差差 越越大大,所所需需样样本本含含量量越越多多; ;总总体体概概率率越越接接近近0.50,0.50,则所所需需样样本本含含量量越越多多。通通常常根根据据预预实实验验、查查阅阅文文献献和和专专业业知知识识判判断断 值值。由由于于总总体体标标准准差差往往往往未未知知或或不不易易获获得得,一一般般可可用用预预试试验验的的样样本本标标准准差差S S来估计或代替。来估计或代替。希望发现或需控制的样本和总体间或两个样本间某统希望发现或需控制的样本和总体间或两个样本间某统计量的差别大小。如计量的差别大小。如 =1 1 2
5、2,或,或 =1 1 2 2。 越小,越小,所需样本含量越多。可作预实验或用专业上有意义的所需样本含量越多。可作预实验或用专业上有意义的差值代替。差值代替。 样样本本含含量量估估计计的的方方法法较较多多,有有些些公公式式较较为为复复杂杂,计算繁琐。最常用的几种方法有:计算繁琐。最常用的几种方法有:三、样本含量的估计方法样本含量的估计方法样本含量的估计方法查表法查表法计算法计算法单样本均数检验或均数的配对检验单样本均数检验或均数的配对检验两样本均数的比较两样本均数的比较两样本率的比较两样本率的比较 (1)(1)单样本均数检验或均数的配对检验单样本均数检验或均数的配对检验计算公式:计算公式:计算公
6、式:计算公式: 有有单单侧侧和和双双侧侧之之分分,为为标标准准正正态态分分布布, 只只取取单单侧侧值值。自自由由度度,然然后后查查t t值值表表,利利用用公公式式再再计计算算N N。若为配对比较,若为配对比较,取取若用若用S S估计,则取估计,则取上述公式也适用于交叉设计的样本含量估计。上述公式也适用于交叉设计的样本含量估计。()()例例8-1 8-1 呋喃丙胺治疗血吸虫病人血红蛋白变化。呋喃丙胺治疗血吸虫病人血红蛋白变化。=10g/L,=25 g/L,双侧,。解:解:代入公式代入公式以自由度以自由度查t界界值表表 例例8-2 8-2 某医师试验某种升白细胞药的疗效,先以某医师试验某种升白细胞
7、药的疗效,先以9 9例低白细胞例低白细胞病人做预试验,结果计算出用药前后白细胞病人做预试验,结果计算出用药前后白细胞差值差值的标准差为的标准差为千个千个/mm/mm3 3( (或或109/L)109/L),现要做正式临床试验,且要求白细,现要做正式临床试验,且要求白细胞平均上升胞平均上升1 1千个千个/mm/mm3 3才算该药有临床实际有效,才算该药有临床实际有效,问要多少病人进行正式临床试验?问要多少病人进行正式临床试验? 解:解:单侧单侧代入公式代入公式取取54要要5454例病人进行正式临床试验例病人进行正式临床试验以自由度以自由度查t界界值表表 (2)两样本均数比较)两样本均数比较Q1和
8、和Q2为样本比例,本比例,Q1 n1/N, Q2 n2/N,N= n1+n2, 有有单单侧侧和和双双侧侧之之分分,为为标标准准正正态态分分布布, 只只取取单单侧侧值值。自自由由度度,然然后后查查t t值值表表,利利用用公公式式再再计计算算N N,N N为两样本总例数为两样本总例数。计算公式:计算公式:计算公式:计算公式:(8 82 2)当样本比例不等时:当样本比例不等时:Q Q1 1+Q+Q2 2=1=1;当两样本例数相等时:当两样本例数相等时:Q Q1 1Q Q2 2。例例8-8-用新药降低高血脂患者的胆固醇,研究者规定试验用新药降低高血脂患者的胆固醇,研究者规定试验组与对照组(安慰剂)相比
9、,平均降低组与对照组(安慰剂)相比,平均降低2020/L/L以上,才有实以上,才有实际推广应用价值。以参考文献中得知胆固醇的标准差为际推广应用价值。以参考文献中得知胆固醇的标准差为3030/L/L。规定单侧,要求估计样本含量。规定单侧,要求估计样本含量。(条件是(条件是 (1 1)Q Q1 1,Q Q2 2; (2 2)Q Q1 1=Q=Q2 2)解:解:规定,Q1,Q2;单侧,; S=30/L,=20/L。 代入公式代入公式总例数总例数8080例;试验组例数例;试验组例数800.4=32800.4=32例;对照组例数例;对照组例数800.6=48800.6=48例。例。 解:解:规定,Q1=
10、Q2;单侧,; S=30/L,=20/L。 代入公式代入公式 从上述计算可以看出,在其它条件不变的情况从上述计算可以看出,在其它条件不变的情况下,若两组含量的比例相同,则所需样本含量最少。下,若两组含量的比例相同,则所需样本含量最少。(3)样本率与总体率的比较)样本率与总体率的比较 (大样本大样本) (8-3)(8-3)计算公式:计算公式:计算公式:计算公式: 有有单单侧侧和和双双侧侧之之分分,为为标标准准正正态态分分布布, 只只取取单单侧侧值值。自自由由度度,然然后后查查t t值值表表,利利用用公公式式再再计计算算n n。式中式中为已知已知总体率,体率,为预期期实验结果的果的总体率,体率,
11、例例8-4 8-4 已知用常规方法治疗某病的有效率是已知用常规方法治疗某病的有效率是8080,现试验一种,现试验一种新的治疗方法,预计有效率是新的治疗方法,预计有效率是9090。给定。给定 问至少需要观察多少病例?问至少需要观察多少病例? 解:解: 代入公式代入公式需要观察需要观察137137个病例。个病例。(4)配对二分类资料的)配对二分类资料的2检验检验 (8-4)(8-4)计算公式:计算公式:计算公式:计算公式: 式中,式中,同上;同上; 为两两总体的阳性概率,体的阳性概率, 为两两处理理结果一致的果一致的总体阳性概率,体阳性概率, 例例8-5 8-5 拟比较甲、乙两种血清学方法对鼻咽癌
12、患者的检出情况,拟比较甲、乙两种血清学方法对鼻咽癌患者的检出情况,初步估计甲法的阳性检出率为初步估计甲法的阳性检出率为91%91%,乙法的阳性检出率为,乙法的阳性检出率为75%75%,两种方法一致的阳性检出率为两种方法一致的阳性检出率为73%73%。请估计样本含量。请估计样本含量。 设解:解:本例本例代入公式代入公式因此,需要约因此,需要约5858名鼻咽癌患者的血清。名鼻咽癌患者的血清。 (5)两组样本频率检验)两组样本频率检验 (8-5)(8-5)计算公式:计算公式:计算公式:计算公式:式中式中为两两总体合体合计概率,概率,其它符号同前。,其它符号同前。例例8-6 8-6 用旧药治疗慢性肾炎
13、的近控率为30%,现试验新药疗效,新药的近控率须达到50%才有推广使用价值。已知合并率 =40%;定(单侧),1,问每组需要多少病例?解:解:, (1 1)若要求两组例数相等,则:)若要求两组例数相等,则:两组总例数为两组总例数为206206例,每组需例,每组需103103例。例。 Q Q1 1Q Q2 2。(2 2)设新药组占)设新药组占60%60%,旧药组占,旧药组占40%40%,则:,则:新药组:新药组:2090.6=1252090.6=125例例旧药组:旧药组:2090.4=842090.4=84例例Q1和和Q2为样本比例,本比例,Q1 n1/N, Q2 n2/N,N= n1+n2,实实 验验 设设 计计一、影响样本含量估计的因素(一)检验水准:(一)检验水准:(一)检验水准:(一)检验水准:(二)检验效能:(二)检验效能:(二)检验效能:(二)检验效能:1-1-1-1-(三)总体变异度:(三)总体变异度:(三)总体变异度:(三)总体变异度:或或或或(四)容许误差:(四)容许误差:(四)容许误差:(四)容许误差:=1 1 1 1-2 2 2 2或或或或=1 1 1 1-2 2 2 2二、样本含量的估计方法二、样本含量的估计方法样本含量的估计方法样本含量的估计方法查表法查表法计算法计算法