医学医学统计学第六章统计推断基础

资源描述

《医学医学统计学第六章统计推断基础》由会员分享，可在线阅读，更多相关《医学医学统计学第六章统计推断基础（87页珍藏版）》请在金锄头文库上搜索。

1、1第六章第六章统计推断基础统计推断基础2统计方法的结构统计方法的结构36.16.1抽样误差与标准误抽样误差与标准误6.1.16.1.1 抽样误差抽样误差抽样误差：在抽样研究中产生的样本统计量与相应的总体参数之间的差异总体总体样本样本抽样抽样4来自同一总体的若干样本的统计量之间，也会存在误差，这种误差也反映了样本统计量和总体参数间的差异总体总体样本样本1样本样本2样本样本n5抽样误差的表现形式：抽样误差的表现形式：（1）样本统计量与总体参数间的差异（2）不同样本统计量间的差异总体总体样本样本抽样抽样总体总体样本样本1样本样本2样本样本n6抽样误差的类型：根据资料的性质和指标的类型不同，抽样误

2、差有多种 (1)均数的抽样误差 (2)率的抽样误差由于生物间的个体差异是客观存在的，因此在抽样研究过程中，抽样误差是不可避免的抽样误差具有一定规律性76.1.2 6.1.2 标准误标准误样本统计量的标准差称为标准误标准误除了反映样本统计量之间的离散程度外，同时也反映样本统计量与相应的总体参数间的差异，即抽样误差大小。总体总体样本样本1样本样本2样本样本n8最常用的标准误有两种，即均数的标准误和率的标准误91）均数的标准误将来自同一总体的若干个样本均数看作一组新的观察值，研究这些样本均数的频数分布，包括集中趋势与离散趋势，可计算样本均数的均数与标准差总体总体样本样本1样本样本2样本样本n

3、10【例】某市16岁女中学生的身高分布服从均数()为155.4cm，标准差()为5.3cm的正态分布。作抽样模拟试验，每次随机抽出10个观察值(即样本例数n=10)，共抽取100个样本 11当原始观察值的分布为正态分布时，样本均数的频数分布基本接近正态分布。统计理论还证明，如果原始观察值分布为偏态分布，当样本例数n较大时，其样本均数的分布仍近似服从正态分布12均数标准误反映来自同一总体的样本均数的离散程度以及样本均数与总体均数的差异程度，即均数的抽样误差大小均数标准误的计算理论值：估计值：可适当增加样本例数和减少观察值的离散程度(如选择同质性较好的总体)来减少抽样误差。13均数标准误的

4、用途 1.衡量样本均数的可靠性 2.估计总体均数的可信区间 3.用于均数的假设检验 142）率的标准误率的标准误衡量样本率的离散趋势和率的抽样误差的统计指标。率的标准误愈大，则样本率的离散程度愈高，率的抽样误差愈大，反之亦然总体总体样本样本1样本样本2样本样本n15率的标准误的计算率的标准误的计算若总体率为已知，当样本例数为n时若总体率未知，则以样本率代入，求得率的标准误的估计值 166.1.3 6.1.3 t t分布分布英国统计学家英国统计学家 GossetGosset (1876-1937) (1876-1937)17t分布曲线是一簇对称于0的曲线。随着自由度增大，t分布曲线逐渐逼

5、近标准正态曲线，当自由度为无穷大时，t分布曲线和标准正态曲线完全吻合18单侧（双侧）t界值（t分位数）196.2 6.2 参数估计参数估计6.2.1 6.2.1 参数估计的意义参数估计的意义反映总体特征的统计指标称为参数参数(parameter) 在抽样研究中，对总体参数的估计是统计推断的主要内容之一。参数估计参数估计就是用样本统计量估计总体参数。206.2.2 6.2.2 估计方法估计方法 1.点估计(point estimation) 用样本统计量的值直接作为总体参数的估计值优缺点:估计方法简单易行，但未考虑抽样误差 212.区间估计(interval estimation) 以一定概

6、率估计总体参数在哪个范围内的这种估计方法称为区间估计总体均数的区间估计总体率的区间估计22在正态分布N(，2) 中，若总体标准差已知时，总体均数的区间估计简写为（1）总体均数的区间估计 1 已知时23按正态分布的原理，总体均数的区间估计简写为 2 未知时，n足够大24【例6.1】已知某地150名正常成人脉搏均数73.53次/分，标准差11.30次/分，试估计该地正常成人脉搏总体均数95%可信区间。25 根据t分布的原理，当=0.05时，有95%的t值在- t0.025, 到 t0.025, 间，即P (- t0.025, t 时，不拒绝H0 496.3.2 6.3.2 假设检验的步

7、骤假设检验的步骤 1）建立检验假设(H0)和备择假设(H1) 2）确定检验水准和单、双侧一般取=0.05 3）选定检验方法和计算检验统计量 4）确定P值 5）推断结论 506.4 6.4 t t检验和检验和u u检验检验假设检验的方法常以选定的检验统计量的分布而命名例如：统计学中常用的t检验，卡方检验，F检验等。 6.4.1 6.4.1 t t检验检验 1）t检验的应用条件（1）当样本例数n较小，样本取自正态总体，总体标准差未知。（2）在作两个样本均数比较时，还要求两样本相应的总体方差相等，称为方差齐性。512）样本均数与总体均数比较的t检验推断样本所属的未知的总体均数

8、与已知的另一总体均数是否相等。检验统计量为：例题6.5就是这种t检验。南京南京7岁男童岁男童身高身高北京北京7岁男童岁男童身高身高样本样本52 3）配对设计数值资料的t检验【例6.6】为研究一种新药对女性血清胆固醇含量是否有影响，对20名女性根据同年龄和体重相近的原则配成10对。每对中一个服用新药，另一个服用不含活性，但形态、颜色与新药相同的安慰剂，经一段时间后，测定血清胆固醇含量(mmol/L)，结果见表6.2第(1)(3)栏，问服新药与服安慰剂血清胆固醇含量有无差别? 53差值差值d的总体的总体若新药对血清胆固醇没有影响，则若新药对血清胆固醇没有影响，则理论上差值理论上差值

9、d的总体均值应为的总体均值应为0。54（1)建立检验假设建立检验假设与备择假设与备择假设（2)确定检验水准和单、双侧确定检验水准和单、双侧本例=0.05，双侧（3)计算统计量计算统计量 55其中56（4）确定确定P P值值（5）判断结论判断结论按=0.05水准，不拒绝H0，可以认为服用该新药不影响女性血清胆醇。 57【例6.7 】某医师用一种中药治疗高血压患者，观察患者治疗前后舒张压（kPa）变化（见表6.3），问该中药是否对高血压患者治疗前后舒张压有影响？58591)建立检验假设 2)确定检验水准和单、双侧本例=0.05，双侧 3)计算统计量 60其中614）确定P值 5）判断

10、结论按=0.05水准，拒绝H0，接受H1，可以认为该中药治疗高血压患者的舒张压在治疗前后有差别，治疗后舒张压降低。 624 4）成组设计的两样本均数比较的）成组设计的两样本均数比较的t t检验检验分别从两个总体中抽取样本，对两个样本均数作比较，因而称为成组比较。目的是推断两个样本各自所属总体的总体均数和是否有差别总体总体1总体总体263所用的检验统计量t6465【例6.8】两组雄性大鼠分别以高蛋白和低蛋白饲料喂养后，观察第28天到第84天间，每只大鼠所增加的体重（见表6.4）。问两组不同蛋白质饲料喂养大鼠，体重增加是否有差别? 表表6.4 6.4 以高蛋白和低蛋白饲料喂养大鼠后体重

11、增加（以高蛋白和低蛋白饲料喂养大鼠后体重增加（g g）高蛋白组高蛋白组 134 146 104 119 124 161 107 83 113 129 97 123134 146 104 119 124 161 107 83 113 129 97 123低蛋白组低蛋白组 70 118 101 85 107 132 9470 118 101 85 107 132 9466（1）建立假设建立假设（2）确定检验水准和单双侧确定检验水准和单双侧（3）计算统计量计算统计量 67（4）确定确定P值值（5）推断结论推断结论 68方差齐性检验方差齐性检验已知：两组样本标准差s1， s2、两组样本含量n1， n

12、2 。检验：两组总体方差是否有差别总体总体1总体总体269步骤：1）建立假设，确定检验水准与单双侧2）确定检验水准和单双侧3）计算检验统计量 704）确定P值5）推断结论按=0.05水准不拒绝H0，可以认为两组总体方差相同。716.4.2 u检验单个总体：不论数值变量X的分布是否服从正态分布，当样本例数n足够大时；如果X服从正态分布，则不论样本n的大小，都有总体总体样本样本1样本样本2样本样本n72标准正态分布的界值点标准正态分布的界值点：推断结论推断结论：总体，总体均数总体，总体均数未知，未知，总体标准差已知总体标准差已知73对成组设计的两个样本均数比较进行u 检验当两个样本例

13、数和都较大时，样本均数近似服从正态分布，这时可以用u检验总体总体1总体总体274标准正态分布的界值点标准正态分布的界值点：推断结论推断结论：总体总体1总体总体275【例6.9】研究正常人与高血压患者血清胆固醇含量（mmol/L）的资料如下，试比较两组血清胆固醇含量有无差别。 76（1）建立假设（2）确定检验水准和单双测（3）计算统计量 77（4）确定P值（5）推断结论 786.5 6.5 第一类错误和第二类错误第一类错误和第二类错误第一类错误第一类错误检验假设H0实际上成立的，但拒绝了H0，误判为有差别，也就是犯了假阳性错误，称为第一类错误(type error，或弃真错误) ；第一类错

14、误的概率即检验水准用表示. 若定在0.05，就是当H0成立时，从理论上说，平均每100次抽样中允许产生推断的错误有5次79第二类错误第二类错误检验假设H0实际上不成立，但却不拒绝H0，也就是错误地判为无差别，犯了假阴性错误，称为第二类错误(type error，或取伪错误). 第二类错误的概率用表示。统计上将1-称为检验效能或把握度(power of a test)，即两个总体确有差别存在，而以为检验水准，假设检验能发现它们有差别的能力。80推断结论和两类错误推断结论和两类错误实实际际情情况况检验结果检验结果拒绝拒绝H0不拒绝不拒绝H0H0为真为真第一类错误第一类错误（）结论正确结论正确

15、（）H0不真不真结论正确结论正确（）第二类错误第二类错误（）81当样本例数固定时，愈小，愈大；反之，愈大，愈小。因而可以通过选定控制大小要同时减小和，唯有增加样本例数。实际工作中应权衡两类错误中哪一个重要，以选择检验水准的大小。82 和的关系你不能同时减你不能同时减少两类错误少两类错误! 和和和和的关系就像的关系就像的关系就像的关系就像翘翘板，翘翘板，翘翘板，翘翘板，小小小小就就就就大，大，大，大，大大大大就小就小就小就小836.6 6.6 假设检验时应注意的问题假设检验时应注意的问题1）对所比较的资料应当从同质总体中随机抽取样本,这样的样本具有代表性和均衡可比性。

16、2）应根据研究目的、研究设计的类型和资料特点（变量的种类、样本的大小）等因素来选用符合适用条件的假设检验方法。 843）实际差别大小与统计意义的区别统计上的“差别有显著性”不应误解为差别很大或肯定有差别，这种差别也未必在临床上有意义。假设检验结果“有”，“无”统计学意义，主要说明差异由抽样误差引起的可能性大小。例如：例如：某两种药物降低血压相差5mmHg，经检验认为有统计学意义，但这种差异在临床却没有什么意义85建议对检验结果用下列方式表达 P，拒绝H0，接受H1，差异有统计学意义； P，不拒绝H0 ，差异没有统计学意义864）所有统计的假设检验都是概率性质的，因此，在作推论时，可能犯错误。5）单侧检验与双侧检验的选择应事先根据专业知识和问题的要求在设计时确定采用单侧还是双侧，不能在计算检验统计量后才主观确定。 6）样本含量的大小对假设检验方法的选择和统计显著性是有影响的。87配对设计常见的几种类型：（1）异体配对异体配对：将条件相同或相近的实验对象配成对子，然后采用随机化方法将对子分配到各组（2）前后配对前后配对：同一对象实验前后（或治疗前后）进行比较（3）自身配对自身配对：同一样品采用不同的方法处理（4）左右配对左右配对：同一个体左右两侧的器官或组织，一侧施加处理因素，一侧给予对照物

展开阅读全文

医学医学统计学第六章统计推断基础

最新文档