随机化与样本含量估计周二晚柳伟伟

上传人:宝路 文档编号:48329957 上传时间:2018-07-13 格式:PPT 页数:66 大小:713.26KB
返回 下载 相关 举报
随机化与样本含量估计周二晚柳伟伟_第1页
第1页 / 共66页
随机化与样本含量估计周二晚柳伟伟_第2页
第2页 / 共66页
随机化与样本含量估计周二晚柳伟伟_第3页
第3页 / 共66页
随机化与样本含量估计周二晚柳伟伟_第4页
第4页 / 共66页
随机化与样本含量估计周二晚柳伟伟_第5页
第5页 / 共66页
点击查看更多>>
资源描述

《随机化与样本含量估计周二晚柳伟伟》由会员分享,可在线阅读,更多相关《随机化与样本含量估计周二晚柳伟伟(66页珍藏版)》请在金锄头文库上搜索。

1、随机化及其SAS实现医学统计学教研室柳伟伟 讲师实例辨析n在一项基础医学研究中,将15只大鼠分为 三组,先对所有大鼠施加某种处理,建立 疾病模型,然后采用三种不同的药物治疗n在治疗前、治疗后1周、治疗后2周、治疗 后3周分别观测大鼠的三项指标实例辨析n在对治疗前的数据进行分析时,发现三组 之间有两项指标的差别有统计学意义n原因何在?怎样做才能尽量避免这种 差别的出现?随机原则回顾n随机原则是指采用随机的方式来选取和分 配样本,即研究总体中每个个体都具有同 等的机会被抽中进入样本,而样本中每个 受试对象都有同等的机会被分配到各个试 验组中随机分组方法n完全随机化n分层随机化n区组随机化n分层区组

2、随机化n动态随机化完全随机化n直接对受试对象进行随机化分组,常通过掷硬币 或随机数字表,或用计算机产生随机数来进行随 机化,在事先或者实施过程中不作任何限制和干 预或调整n分组后各组受试对象的例数不一定相等查表法的实施步骤n第一步,将受试对象编号,将编号按顺序 写成一排n第二步,事先规定分组的规则。分组规则 可以有多种方式,但必须事先确定下来, 一旦确定不应随意改动查表法的实施步骤n如分两组时,可规定遇到随机数字为偶数时将对 应的受试对象分入实验组、遇到随机数字为奇数 时将对应的受试对象分入对照组n再如分三组时,可事先规定,凡随机数字除以3余 数为0者分入第一组、余数为1者分入第二组、余 数为

3、2者分入第三组查表法的实施步骤n第三步,从随机数字表中任意指定的位置开始向 后(或向前)抄录随机数字,依次写在各编号之 下,注意:舍弃不符合要求的随机数字n第四步,根据抄录的随机数字按事先确定的分组 规则分组 利用查表法实现完全随机分组n某医生为了研究一种降血脂新药的临床疗 效,按统一纳入标准选择120名患者,采用 完全随机设计方法将患者等分为四组进行 双盲试验。问如何进行分组?利用查表法实现完全随机分组n先将120名高血脂患者从1开始到120编号,见第一行n从随机数字表中的任一行任一列开始,如第5行第7 列开始,依次读取三位数作为一个随机数录于编号 下,见第二行利用查表法实现完全随机分组n然

4、后将全部随机数由小到大编序号,将每 个随机数对应的序号记在第三行n规定序号130为甲组,3160为乙组, 6190为丙组,91120为丁组,见第四行利用SAS实现完全随机分组n现有100只小鼠,编号为1-100号,试将它们 完全随机均分入甲、乙两个试验组中去 利用SAS实现完全随机分组nproc plan;nfactors no=100;noutput out=a;nrun;ndata b c;nset a;nmouse=_n_;nif no=50 then do;n group=甲; noutput b;drop no;n end; nelse do;n group=乙; noutput c

5、;drop no;n end;nrun;利用SAS实现完全随机分组ndata d;nset b c;nrun;nproc print data=d;nrun;完全随机化的效果是否总是最好 n完全随机化的效果是否总是最好?不一定!关键 取决于样本含量的大小n若样本含量很大,完全随机化的效果应当是比较 理想的;若样本含量比较小,有时完全随机化的 结果可能很糟糕n此时,宜采用分层随机化 分层随机化n首先对可能影响试验过程和结果的主要混 杂因素(如年龄、性别、病情、疾病分期 等)进行分层,然后在每一层内进行完全 随机化分组,最后分别合并为试验组和对 照组分层随机化n分层目的:使某些对结果影响较重的因素

6、在各组 中尽可能相等n分层因素选择:根据不同疾病n分层因素的数量和分级:不宜太多,否则组合太 多且病人收集有一定困难分层随机化n现有24只小鼠,其中16只雌性,8只雄性n若采用完全随机化方式将他们均分成两组,则有 可能某一组中的12只小鼠全是雌性的,另一组中 有4只雌性、8只雄性小鼠n当小鼠性别对观测结果有较大影响时,性别这个 重要的非实验因素就会严重地影响实验因素两个 水平对观测结果效应大小的正确评价分层随机化n此时,宜采用分层随机化n先用完全随机化法将16只雌性小鼠随机均 分成两组,实验组和对照组各8只;再用完 全随机化法将8只雄性小鼠随机均分成两组 ,实验组和对照组各4只样本含量估计及其

7、SAS实现医学统计学教研室柳伟伟 讲师一、样本含量和检验效能的含义n样本含量(sample size)也叫样本大小或样 本例数,是一项科研工作中,拟进行调查 的被调查对象的个体数或拟用于试验研究 的动物只数或新药临床试验中拟观察的患 者例数一、样本含量和检验效能的含义n总样本量用N表示,各组的样本含量用n表 示n若各组的样本含量不相等,则给“n”加上右 下标n不仅要关注N的大小,更应关注n的大小一、样本含量和检验效能的含义n检验效能也称为把握度,是指当对比组的参数之 间确实存在有意义的差别时,假设检验能够发现 这种差别的能力或概率型错误概率 二、估计样本含量和检验效能的意义n在医学科研工作中,

8、无论抽样调查,临床 试验或实验研究,正确确定样本含量都是 一项十分重要的内容,也是一个需要科研 人员给予认真考虑的问题二、估计样本含量和检验效能的意义n根据假设检验的原理,若样本太小,会使本来存 在的差别不能显示出来,难以获得正确的研究结 果,结论也缺乏充分的依据n反之,若样本太大,也会增加实际工作中的困难 ,不必要地浪费人力、物力、财力和时间,此外 ,由于样本太大,可能投入不足,科研过程的质 量控制下降,从而引入不必要的干扰因素,对研 究结果造成不良影响二、估计样本含量和检验效能的意义n目前,不管是从期刊杂志上发表的论文,还是从 实际科研人员的实验记录等科研档案来看,绝大 多数研究工作都没有

9、交代样本含量的确定方法、 计算依据及公式,没有进行科学的、有理有据的 样本含量估计n当假设检验的结果为“阴性”,即不能拒绝原假设 (H0)时,也很少有研究者去估计假设检验的检 验效能,进而判断“阴性”结果的可信度如何二、估计样本含量和检验效能的意义n造成这种状况的原因:一是研究者没有认识到样本含量估计与检验效能 分析对科学研究的重要性二是研究者不知道如何进行样本含量与检验效能 估计三、估计样本含量时应具备的条件n影响样本含量估计的因素:拟开展的研究类型 研究中将涉及到的因素的个数及其水平数的多少观测的效应指标的性质 必不可少的前提条件三、估计样本含量时应具备的条件n检验水准或显著性水平:即事先

10、规定本次试验允 许犯型(或假阳性)错误的概率,通常规定 =0.05,同时还应明确是单侧检验还是双侧检验 。定得越小,所需的样本含量越大三、估计样本含量时应具备的条件n检验效能:要求的检验效能越大,所需的样本含 量就越大,实际上,检验效能由犯型错误的概 率的大小所决定。在科研设计时,检验效能不宜 低于0.75,否则检验的结果很可能反映不出总体 的真实差别,出现非真实的阴性结果三、估计样本含量时应具备的条件n样本推断总体的一些信息:在不同的情形 下需要提供的信息会有所不同,可以通过 专业知识、文献资料或预试验结果获得四、样本含量与检验效能估计的具体情形n估计总体均值与总体率n单组设计均值的检验n配

11、对设计均值与率的检验四、样本含量与检验效能估计的具体情形n成组设计均值与率的差异性检验、等效 性检验、非劣效性检验n单因素多水平设计均值与率的检验n两因素析因设计定量资料方差分析样本含量与检验效能估计的SAS实现方式n根据计算公式编制程序:SAS数据步+宏n利用SAS过程估计:POWER过程、 GLMPOWER过程(一)估计总体均值时样本含量的估计 标准正态分布 分位数总体标准差 容许误差 t 分布分位数 样本标准差 (一) 估计总体均值时样本含量的估计(二)估计总体率时样本含量的估计容许误差 总体率或 样本率(二)估计总体率时样本含量的估计(二)估计总体率时样本含量的估计(三)单组、配对设计

12、定量资料统计分析时 样本含量估计 标准差 总体效应差值 (三)单组、配对设计定量资料统计分析时 样本含量估计(四)成组设计定量资料统计分析时样本含量估计 标准差 两组总体 效应差值 (四)成组设计定量资料统计分析时样本含量估计 标准差 两组总体 效应差值 (四)成组设计定量资料统计分析时样本含量估计(五)单因素多水平设计定量资料方差分析时 样本含量估计标准差 均数 (五)单因素多水平设计定量资料方差分析时 样本含量估计(六)两因素析因设计定量资料方差分析时 样本含量估计 (七)两样本率比较时样本含量的估计 两组合并率 总体率 (七)两样本率比较时样本含量的估计 总体率 (七)两样本率比较时样本

13、含量的估计(八)配对设计四格表资料统计分析时样本含量估计 (八)配对设计四格表资料统计分析时样本含量估计(九)成组设计定量资料的等效检验时样本含量的估计总体均数 等效界值 标准差 (九)成组设计定量资料的等效检验时样本含量的估计(十)成组设计定量资料的非劣效检验时样本含量的估计总体均数 差值非劣效界值 标准差 (十)成组设计定量资料的非劣效检验时样本含量的估计(十一)成组设计定性资料的等效检验时样本含量的估计总体率 等效界值 (十一)成组设计定性资料的等效检验时样本含量的估计(十二)成组设计定性资料的非劣效检验时样本含量的估计总体率 差值非劣效界值 (十二)成组设计定性资料的非劣效检验时样本含量的估计五、几个需要特别说明的问题n在其他条件等同的情况下,定性指标所需的样本含量大于 定量指标每组88只小鼠 每组324只小鼠 五、几个需要特别说明的问题n同一问题,在其他条件不变的情况下,用单侧检验比用 双侧检验所需的样本含量要少,但究竟该用单侧检验还 是双侧检验取决于专业知识,而不是人的意愿每组88只小鼠 每组72只小鼠 五、几个需要特别说明的问题n同一问题,在其他条件不变的情况下,对检验效能的要 求越高,需要的样本含量越大每组88只小鼠 每组66只小鼠 每组59只小鼠

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号