医学统计学教学课件-第三章计量资料的统计推断

上传人:夏** 文档编号:567897729 上传时间:2024-07-22 格式:PPT 页数:62 大小:249.50KB
返回 下载 相关 举报
医学统计学教学课件-第三章计量资料的统计推断_第1页
第1页 / 共62页
医学统计学教学课件-第三章计量资料的统计推断_第2页
第2页 / 共62页
医学统计学教学课件-第三章计量资料的统计推断_第3页
第3页 / 共62页
医学统计学教学课件-第三章计量资料的统计推断_第4页
第4页 / 共62页
医学统计学教学课件-第三章计量资料的统计推断_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《医学统计学教学课件-第三章计量资料的统计推断》由会员分享,可在线阅读,更多相关《医学统计学教学课件-第三章计量资料的统计推断(62页珍藏版)》请在金锄头文库上搜索。

1、1统计推断统计推断(Statistical inference):用样本信用样本信息推论总体特征的过程。息推论总体特征的过程。包括:包括:参数估计参数估计: 运用统计学原理,用从样本计算出来的运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。统计指标量,对总体统计指标量进行估计。假设检验:假设检验:又称显著性检验,是指由样本间存在的又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。差别对样本所代表的总体间是否存在着差别做出判断。2主要内容第一节第一节 标准误标准误第二节第二节 t 分布分布第三节第三节 总体均数的估计总体均数的估计第四节第四

2、节 假设检验假设检验第五节第五节 未知总体与已知总体均数的未知总体与已知总体均数的 比较比较第六节第六节 完全随机设计两总体均数的比较完全随机设计两总体均数的比较第七节第七节 配对设计资料均数的比较配对设计资料均数的比较 第八节第八节 均数假设检验的注意事项均数假设检验的注意事项3第一节第一节 标准误(标准误(Standard error)一、概念一、概念抽样误差:抽样误差:由于抽样引起的样本由于抽样引起的样本统计量统计量与总与总体体参数参数之间的差异。之间的差异。标准误标准误 :( x Sx) 表示抽样误差大小的指表示抽样误差大小的指标;标; 样本均数的标准差;样本均数的标准差; 4X 1S

3、1X 2 S2 X ISiX nSnx标准误示意图标准误示意图5三、三、 (均数)标准误(均数)标准误意义:意义:反映抽样误差的大小。标准误越小,抽样反映抽样误差的大小。标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越误差越小,用样本均数估计总体均数的可靠性越大。大。与样本量的关系:与样本量的关系:S 一定,一定,n,标准误,标准误二、(均数)标准误的计算二、(均数)标准误的计算6SPSS计算标准误lAnalyze-Descriptive Statistics-Frequencies-Statistics-Dispersion-S.E. mean-Continue-OK7大数定理:大

4、数定理:当样本量足够大时,样本的均数以很当样本量足够大时,样本的均数以很大的概率接近总体均数(计量资料)。大的概率接近总体均数(计量资料)。 当试验次数足够多时,事件当试验次数足够多时,事件A A出现的频率就会出现的频率就会接近于概率接近于概率P P(计数资料)。(计数资料)。中心极限定律中心极限定律:正态分布也称为中心分布。:正态分布也称为中心分布。 如果所研究的随机变量可以表示为大量独立如果所研究的随机变量可以表示为大量独立随机变量的和,其中每一个随机变量对于总和只随机变量的和,其中每一个随机变量对于总和只起微小作用,则可以认为这个随机变量近似服从起微小作用,则可以认为这个随机变量近似服从

5、正态分布,其均数也近似服从正态分布。正态分布,其均数也近似服从正态分布。两个基本定律(了解)8一、t 分布的概念:从正态分布演化到t 分布的5个步骤。反应抽样误差分布的规律。二、t 分布图形:三、t 分布面积特征( t界值表):第二节 t 分布9t 分布的图形(分布的图形(u 分布分布 是是t 分布的特殊形式)分布的特殊形式)10t 值表值表(附表(附表2 ) 横坐标:自由度,横坐标:自由度, 纵坐标:概率,纵坐标:概率, p, 即曲线下阴影部分的面积即曲线下阴影部分的面积; 表中的数字:相应的表中的数字:相应的 |t | 界值。界值。11t 值表规律:值表规律:(1) 自由度(自由度()一定

6、时,)一定时,p 与与 t 成反比成反比;(2) 概率(概率(p) 一定时,一定时, 与与 t 成反比成反比;12第三节第三节 总体均数的估计总体均数的估计统计推断的任务就是用样本信息推论总统计推断的任务就是用样本信息推论总体特征。体特征。参数估计,参数估计,用样本均数估计总体均数。用样本均数估计总体均数。 1、 点(值)估计(近似值)点(值)估计(近似值)2、 区间估计(近似范围)区间估计(近似范围)131、点点(值值)估计(估计(point estimation):用样本均数直接作为总体均数的估计值,用样本均数直接作为总体均数的估计值, 未考虑抽样未考虑抽样误差。误差。142、区间估计、区

7、间估计(interval estimation) 概念概念:根据样本均数,按一定的根据样本均数,按一定的可信度可信度计算计算 出总体均数很可能在的一个出总体均数很可能在的一个数值范围数值范围,这个,这个范围称为总体均数的范围称为总体均数的可信区间可信区间(confidence interval, CI)。 方法:方法:(1) u 分布分布 法法(2) t 分布法分布法15(1)u 分布分布 法法公式公式应用条件应用条件:例题例题意义:与正常值范围进行比较意义:与正常值范围进行比较(xus x,xu s x) 即(xus x)样本量较大, 已知或可计算出 x 及 Sx16 换句话说,做出校全体女

8、大学生身高均数为换句话说,做出校全体女大学生身高均数为163.0 - 164.5cm的结论,说对的概率是的结论,说对的概率是95%,说错,说错的概率是的概率是5%;做出校全体女大学生身高均数为;做出校全体女大学生身高均数为162.7 164.7cm的结论,说对的概率是的结论,说对的概率是99%,说错的概率,说错的概率是是1%。意义:意义:虽然不能知道某校全体女大学生身高均数的虽然不能知道某校全体女大学生身高均数的确切数值,但有确切数值,但有95%的把握说校全体女大学生身的把握说校全体女大学生身高均数在高均数在163.0 - 164.5cm之间,有之间,有99%的把握说的把握说校全体女大学生身高

9、均数在校全体女大学生身高均数在 162.7 164.7cm之间。之间。17(2)t 分布分布 法法公式公式应用条件应用条件例题例题意义意义(x ts x,xt s x) 即(xts x)样本量 较小, 已知或可计算出 X 及s x18SPSS求可信区间lAnalyze-Descriptive Statistics-Explore-Statistics-Descriptives-Continue-OK19区间估计的准确度:区间估计的准确度:说对的可能性大小,说对的可能性大小, 用用 (1- ) 来衡量。来衡量。99%的可信区间好于的可信区间好于95%的可信区间的可信区间(n, S 一定时)一定时

10、) 。区间估计的精确度:区间估计的精确度:指区间范围的宽窄,范围越指区间范围的宽窄,范围越宽精确度越差。宽精确度越差。99%的可信区间的可信区间差于差于95%的可信区间的可信区间(n, S 一定时)一定时) 。 准确度与精确度的关系:准确度与精确度的关系:(例如预测孩子的身高)(例如预测孩子的身高)20正常值范围正常值范围概念:概念:绝大多数正常人的某指绝大多数正常人的某指标范围。(标范围。(95%,99%, 指绝指绝大多数正常人)大多数正常人)计算公式:计算公式:用途:判断观察对象的某用途:判断观察对象的某项指标是否正常项指标是否正常.可信区间可信区间概念:概念:总体均数所在的数值总体均数所

11、在的数值范围(范围( 95%,99% 指可信度)指可信度)计算公式:计算公式:用途:估计总体均数用途:估计总体均数正常值范围估计与可信区间估计正常值范围估计与可信区间估计21第四节第四节 假设检验假设检验显著性检验显著性检验;科研数据处理的重要工具科研数据处理的重要工具;某事发生了:某事发生了: 是由于碰巧?还是由于必是由于碰巧?还是由于必然的原因?统计学家运用然的原因?统计学家运用显著性检验来处理这类问显著性检验来处理这类问题。题。22假设检验:假设检验:1、原因2、目的3、原理4、过程(步骤)、过程(步骤)5、结果231、假设检验的原因、假设检验的原因 由于个体差异的存在,即使从同一总体中

12、由于个体差异的存在,即使从同一总体中严格的随机抽样,严格的随机抽样,X1、X2、X3、X4、,、,不同。不同。 因此,因此,X1、X2 不同有两种(而且只有两种)可能:不同有两种(而且只有两种)可能:(1)分别所代表的总体均数相同,由于抽样误差造)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无显著性成了样本均数的差别。差别无显著性 。(2)分别所代表的总体均数不同。差别有显著性。)分别所代表的总体均数不同。差别有显著性。242、假设检验的目的、假设检验的目的l判断是由于何种原因造成的不同,以做出决策。25反证法:当一件事情的发生只有两种可能反证法:当一件事情的发生只有两种可

13、能A和和B,为,为了肯定其中的一种情况了肯定其中的一种情况A,但又不能直接证实,但又不能直接证实A,这,这时否定另一种可能时否定另一种可能B,则间接的肯定了,则间接的肯定了A。概率论(小概率):如果一件事情发生的概率很小,概率论(小概率):如果一件事情发生的概率很小,那么在进行一次试验时,我们说这个事件是那么在进行一次试验时,我们说这个事件是“不会发不会发生的生的”。从一般的常识可知,这句话在大多数情况下。从一般的常识可知,这句话在大多数情况下是正确的,但是它一定有犯错误的时候,因为概率再是正确的,但是它一定有犯错误的时候,因为概率再小也是有可能发生的小也是有可能发生的。 3、假设检验的原理、

14、假设检验的原理/思想思想264、假设检验的一般步骤、假设检验的一般步骤 建立假设(反证法):建立假设(反证法): 确定显著性水平(确定显著性水平( ):): 计算统计量:计算统计量:u, t, 2 确定概率值:确定概率值: 做出推论做出推论27(1 1). . 建立假设建立假设检验假设或者称无效假设检验假设或者称无效假设(null hypothesis),用H H0 0表示, H H0 0假设是假设两总体均数相等。备择假设备择假设(alternative hypothesis),用H H1 1表示。H1是与H0相反的假设,假设两总体均数不相等。28(2)确定确定显著性水平(著性水平(signi

15、ficance level significance level ) 显著性水平()就是我们用来区分大概率事件和小概率事件的标准,是人为规定的。当某事件发生的概率小于时,则认为该事件为小概率事件,是不太可能发生的事件。通常 取0.05 或 0.01。游戏规则游戏规则29(3)计算统计量计算统计量 根据资料类型与分析目的选择适当的公式计算出统计量,比如计算出 u 值 或 t 值。 注意:在检验假设成立的情况下,才会出现的分布类型或公式。30(4)确定概率值(确定概率值(P) 将计算得到的u值或 t值与查表得到u或t,,比较 ,得到 P值的大小。根据u分布和t分布我们知道,如果|u| u或| t

16、| u ,则 P ;如果|u| u或| t | 。31(5)作出推断结论作出推断结论 如果p,认为在检验假设H0成立的条件下,得到等于或大于现有统计量u值或t值的可能性大于,不属于小概率事件,则不拒绝H0,差别无统计学意义,结论是不认为两总体均数不相等。如果p 1.96, p 0.05 = , 小概率事件发生了,小概率事件发生了,原假设不成立;拒绝原假设不成立;拒绝H0 , 接受接受H1, 可认为:可认为:某校女某校女大学生身高均数与一般女子身高均数不同大学生身高均数与一般女子身高均数不同;某校女某校女大学生身高均数与一般女子身高均数大学生身高均数与一般女子身高均数差别有显著性。差别有显著性。

17、 计算统计量:计算统计量:计算统计量:计算统计量:u u 统计量:统计量:统计量:统计量: u = u = 确定概率值:确定概率值: |u|=9.58 u = 1.96 u u p =0.05; 39二、小样本二、小样本已知中学一般男生的心率平均为74次/分钟。为了研究常参加体育锻炼的中学生心脏功能是否与一般的中学生相同,在某地区中学生中随机抽取常年参加体育锻炼的男生16名,测量他们的心率,结果见数据“男生心率.SAV”。40目的:目的:比较一个小样本均数所代表的未知总比较一个小样本均数所代表的未知总 体均数与已知的总体均数有无差别。体均数与已知的总体均数有无差别。计算公式:计算公式: t 统

18、计量:统计量:t= 自由度:自由度: =n - 141 适用条件:适用条件:(1) 已知一个总体均数;已知一个总体均数;(2) 可得到一个样本均数及该样本标准误;可得到一个样本均数及该样本标准误;(3) 样本量样本量小于小于100;(4) 样本来自正态或近似正态总体。样本来自正态或近似正态总体。42例题:例题:已知:已知:(1) 一个总体均数:一个总体均数:74次次/分分 ;(2) 一个样本均数:一个样本均数:65.63次次/分分 ;(3) 可计算出样本标准误:可计算出样本标准误:7.2/ 16=1.8(4) n =16 t0.05(25) , p 0.05 做出推论做出推论: p 0.05

19、, 小概率事件发生了,原假设不成立;小概率事件发生了,原假设不成立;拒绝拒绝H0 , 接受接受H1, 可认为:可认为:常参加体育锻炼的中学男常参加体育锻炼的中学男生的心率与一般中学生不同;常参加体育锻炼的中学生的心率与一般中学生不同;常参加体育锻炼的中学男生的心率比一般中学生心率慢;常参加体育锻炼的男生的心率比一般中学生心率慢;常参加体育锻炼的中学男生的心率与一般中学生差别有显著性。中学男生的心率与一般中学生差别有显著性。45SPSS进行单一样本的假设检验lAnalyze-Compare Means-One Sample T test-test Variable-Option-Confiden

20、ce Interval-Continue-OK46第六节第六节 完全随机设计完全随机设计两总体均数的比较两总体均数的比较l例题:l为了比较国产药和进口药对治疗更年期妇女骨质疏松效果是否相同,采取随机双盲的临床试验方法。国产药组20例,进口药组19例,评价指标为第2-4腰椎骨密度的改变值(骨密度.sav)。47目的:目的:由两个样本均数的差别推断两样本由两个样本均数的差别推断两样本 所代表的总体均数间有无差别。所代表的总体均数间有无差别。 计算公式及意义:计算公式及意义: t 统计量统计量: t =自由度自由度 = n1+n2 2 适用条件:适用条件:(1)已知)已知/可计算两个样本均数及它们的

21、标准差可计算两个样本均数及它们的标准差 ;(2)两个样本之一的例数少于)两个样本之一的例数少于100;48例题:例题:已知:已知:(1)一个样本一个样本: 均数均数48.25, 标准差标准差32.0; (2) 另一个样本另一个样本:均数均数36.37, 标准差标准差27.65;(2) n1=20; n2=1949假设检验:假设检验: 建立假设:建立假设:检验假设检验假设:两组药疗效相同;两组药疗效相同; 备择假设备择假设 :两组药疗效不同不同;两组药疗效不同不同; 确定显著性水平(确定显著性水平( ):):0.0550 计算统计量:计算统计量:t 统计量:统计量: t = 1.238;自由度:

22、自由度:20+ 19 2 = 37表中:表中: t 0.05(37) = 2.026 确定概率值:确定概率值: t 0.05; 做出推论做出推论: 因为因为 p 0.05 , 不能拒绝不能拒绝H0:认为认为 两组药疗效相同。可以用国产药代替进口药两组药疗效相同。可以用国产药代替进口药。51SPSS进行两个样本的假设检验Analyze-Compare Means-Independent Samples T test-test Variable-Grouping-Define Groups-1,2-Continue-OK52第七节第七节 配对设计资料均数的比较配对设计资料均数的比较 (paired

23、 design)什么是配对设计资料? 将可能影响指标的一些特征相同或近似的两个个体配成一对,然后按照随机化方法将每个对子内的两个个体用不同的两种方法进行处理。对处理的结果进行分析。有哪几种形式?53 1 1比比比比较较目的目的目的目的:通:通过对过对两两组组配配对资对资料的比料的比较较,判断不同的,判断不同的处处理效果是否有差理效果是否有差别别,或某种治,或某种治疗疗方法是否起作用。方法是否起作用。 2 2 2 2公式公式公式公式: t = = t = = 自由度自由度: = : = 对对子数子数 - 1 - 13.3.适用条件适用条件适用条件适用条件:.将人或将人或动动物物进进行配行配对对,

24、配好的每,配好的每对对个体分个体分别别随机地分到随机地分到 两个不同的两个不同的处处理理组组中去,接受不同中去,接受不同处处理。理。.观观察同一批病人在治察同一批病人在治疗疗前后的前后的变变化,治化,治疗疗前的数前的数值值和治和治 疗疗后的数后的数值值也是配也是配对资对资料。料。.同一批病人或同一批病人或动动物用不同的方法物用不同的方法处处理。理。 54例题: 为考察一种新型透析疗法的效果,随机抽取了10名病人测量透析前后的血中尿素氮含量如下表,请根据本实验资料对此疗法进行评价。(数据见touxi.sav) 病人序号透析前透析后 131.618.2 220.7 7.3 336.426.5 43

25、3.123.7 529.522.6 620.710.7 750.325.1 831.220.9 936.623.71028.116.555. H0:d = 0 H1:d 0. 确定显著性水平 = 0.05 . 计算统计量: t =7.826. 确定概率:=10 - 1=9。 查表 t 0.05(9) =2.262 t = 7.826 t 0.05(9) p 0.05. 判断结果:因为p 0.05,故拒绝检验假设H0, 10名病人透析前后血中尿素氮含量差异有显著性,即透析可以降低血中尿素氮含量。 56SPSS进行配对样本的假设检验lAnalyze-Compare Means-Paired Sam

26、ples T test-Paired Variable-OK57第第八八节节均数假设检验的注意事项均数假设检验的注意事项581、正确理解假设检验的结论(概率性)、正确理解假设检验的结论(概率性)假设检验的结论是根据概率推断的,所以不是绝对假设检验的结论是根据概率推断的,所以不是绝对正确的:正确的:(1)当 p , 不能拒绝不能拒绝 H0, 不能接受不能接受H1,按不能按不能接受接受H1下结论,也可能犯错误;下结论,也可能犯错误;59J(1) 当拒绝拒绝 H0 时时, 可能犯错误,可能可能犯错误,可能拒绝了实际拒绝了实际上成立的上成立的H0, 称为称为 类类错误( “弃真弃真”的错误的错误 ),

27、),其概率大小用其概率大小用 表示表示。 J(2)当)当不能拒绝不能拒绝 H0 时,也可能犯错误,时,也可能犯错误,没有没有拒拒绝实际上不成立的上不成立的H0 , 这类称称为 II 类类错误( ”存存伪”的的错误), 其概率大小用其概率大小用 表示表示, , 值一般一般不能确切的知道不能确切的知道。2 2、第、第、第、第 I I 类错误和第类错误和第类错误和第类错误和第 II II 类错误类错误类错误类错误假设检验的结果有两种。假设检验的结果有两种。假设检验的结果有两种。假设检验的结果有两种。60 II 类错误的概率类错误的概率 值的值的两个规律:两个规律:1. 当样本量一定时当样本量一定时,

28、 愈小愈小, 则则 愈大愈大,反之反之;2.2.当当 一定时一定时, 样本量增加样本量增加, 减少减少. .613. 统计学中的差异显著或不显著,和日常生统计学中的差异显著或不显著,和日常生活中所说的差异大小概念不同活中所说的差异大小概念不同. (不仅区别于均(不仅区别于均数差异的大小,还区别于均数变异的大小数差异的大小,还区别于均数变异的大小)4、其它注意事项、其它注意事项选择假设检验方法要注意符合其应用条件;选择假设检验方法要注意符合其应用条件;当不能拒绝当不能拒绝H0时,即差异无显著性时,应考虑时,即差异无显著性时,应考虑 的因素:可能是样本例数不够;的因素:可能是样本例数不够; 单侧检验与双侧检验的问题单侧检验与双侧检验的问题62

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号