医学统计学课件

上传人:人*** 文档编号:568900835 上传时间:2024-07-27 格式:PPT 页数:100 大小:419KB
返回 下载 相关 举报
医学统计学课件_第1页
第1页 / 共100页
医学统计学课件_第2页
第2页 / 共100页
医学统计学课件_第3页
第3页 / 共100页
医学统计学课件_第4页
第4页 / 共100页
医学统计学课件_第5页
第5页 / 共100页
点击查看更多>>
资源描述

《医学统计学课件》由会员分享,可在线阅读,更多相关《医学统计学课件(100页珍藏版)》请在金锄头文库上搜索。

1、2024/7/271医学统计学2024/7/272 医学统计学医学统计学第一章第一章 概论概论第二章第二章 集中趋势与离散趋势的统计描述集中趋势与离散趋势的统计描述第三章第三章 t t检验检验第四章第四章 方差分析方差分析第五章第五章 卡方检验卡方检验第六章第六章 非参数检验非参数检验第七章第七章 相关与回归相关与回归2024/7/273第一章第一章 概论概论第一节第一节 医学统计学的意义医学统计学的意义第二节第二节 医学统计工作中的内容和资料类型医学统计工作中的内容和资料类型第三节第三节 医学统计中的基本概念医学统计中的基本概念2024/7/274第一节第一节 医学统计学的意义医学统计学的意

2、义统计分析是科研工作中的一种有力工具。它同统计分析是科研工作中的一种有力工具。它同科研的总体设计、资料采集、资料整理、资料科研的总体设计、资料采集、资料整理、资料分析直到最后作出结论都有密切关系。掌握了分析直到最后作出结论都有密切关系。掌握了这个工具可以使用较少的人力、物力和时间获这个工具可以使用较少的人力、物力和时间获得比较可靠的结果。得比较可靠的结果。只有正确运用统计分析方法,才不致于造成不只有正确运用统计分析方法,才不致于造成不应有的缺陷或得出错误的结论。应有的缺陷或得出错误的结论。2024/7/275第二节第二节 医学统计工作中的内容和资料类型医学统计工作中的内容和资料类型医学统计工作

3、的内容医学统计工作的内容资料的类型资料的类型2024/7/276医学统计工作中的内容医学统计工作中的内容收集资料收集资料收集资料就是根据研究的目的,实验设计的要求,收集资料就是根据研究的目的,实验设计的要求,收集准确的、完整的、充满信息的原始资料。收集准确的、完整的、充满信息的原始资料。整理资料整理资料整理资料就是把收集到的原始资料,有目的地进行整理资料就是把收集到的原始资料,有目的地进行科学加工,使资料系统化、条理化,以便进行统计科学加工,使资料系统化、条理化,以便进行统计分析。分析。分析资料分析资料分析资料就是把经过统计整理的资料,作一系列统分析资料就是把经过统计整理的资料,作一系列统计描

4、述和统计推断,阐明事物的规律性。计描述和统计推断,阐明事物的规律性。2024/7/277资料的类型资料的类型 计量资料计量资料是对每个观察对象的观察指标用定量方法测定该项指标是对每个观察对象的观察指标用定量方法测定该项指标的数值大小所得的资料,一般用度量衡单位表示。的数值大小所得的资料,一般用度量衡单位表示。计数资料计数资料是先将观察对象的观察指标按性质或类别进行分组,然是先将观察对象的观察指标按性质或类别进行分组,然后计数各组该观察指标的数目所得的资料。后计数各组该观察指标的数目所得的资料。等级分组资料等级分组资料在医学实践中,有些资料具有计数资料的特性,同时又在医学实践中,有些资料具有计数

5、资料的特性,同时又兼有半定量的性质,被称为按等级分组资料。兼有半定量的性质,被称为按等级分组资料。2024/7/278第三节第三节 医学统计中的基本概念医学统计中的基本概念变异变异总体和样本总体和样本抽样抽样配对设计与随机区组设计配对设计与随机区组设计误差误差概率概率2024/7/279变变 异异医学研究的对象是有机的生命体,其机能是十医学研究的对象是有机的生命体,其机能是十分复杂的。不同的个体在相同的条件下,对外分复杂的。不同的个体在相同的条件下,对外界环境因素可以发生不同的反应。这种现象称界环境因素可以发生不同的反应。这种现象称只为个体差异或称为变异。只为个体差异或称为变异。由于医学统计研

6、究的对象是有变异的事物,因由于医学统计研究的对象是有变异的事物,因此,用观察此,用观察12例的结果来推论出一般规律是例的结果来推论出一般规律是不恰当的。科学研究工作的主要任务就是要从不恰当的。科学研究工作的主要任务就是要从表现为偶然的大量数据中,分析出其中必然性表现为偶然的大量数据中,分析出其中必然性的规律。的规律。2024/7/2710抽抽 样样代表性代表性就是要求样本中的每一个个体必须符合总体的规定。就是要求样本中的每一个个体必须符合总体的规定。随机性随机性抽签法抽签法机械抽样法机械抽样法分层抽样分层抽样随机数字表随机数字表可靠性可靠性指对实验的结果要有可重复性,即由科研课题的样本的结果指

7、对实验的结果要有可重复性,即由科研课题的样本的结果推论总体的结论有较大的可靠性。推论总体的结论有较大的可靠性。可比性可比性如果进行两个或多个样本之间的比较,那么要求每两个样本如果进行两个或多个样本之间的比较,那么要求每两个样本之间应具有可比性,也称为齐性对比原则。之间应具有可比性,也称为齐性对比原则。2024/7/2711配对设计与随机区组设计配对设计与随机区组设计完全随机设计完全随机设计是将受试对象随机分配到各个处理组或对照组,或是将受试对象随机分配到各个处理组或对照组,或分别从不同总体中随机抽样进行研究。分别从不同总体中随机抽样进行研究。配对设计配对设计它是将受试对象按一定条件配成对子,称

8、为配对样它是将受试对象按一定条件配成对子,称为配对样本,将它们随机分到两个组中,分别给以不同处理。本,将它们随机分到两个组中,分别给以不同处理。随机区组设计随机区组设计它也称为配伍组设计,是配对设计的扩展。配对设它也称为配伍组设计,是配对设计的扩展。配对设计的每一计的每一“对子对子”分别随机分到两个处理中,而配分别随机分到两个处理中,而配伍设计中的每个伍设计中的每个“配伍组配伍组”,包含有多个受试对象,包含有多个受试对象,要将它们分别随机分到各处理组。要将它们分别随机分到各处理组。2024/7/2712误误 差差系统误差系统误差在收集资料过程中,由于仪器初始状态未调到零、标准试剂在收集资料过程

9、中,由于仪器初始状态未调到零、标准试剂未经效正、医生掌握疗效标准偏高或偏低等原因,可使观察未经效正、医生掌握疗效标准偏高或偏低等原因,可使观察结果造成倾向性的偏大或偏小,叫做系统误差。结果造成倾向性的偏大或偏小,叫做系统误差。随机测量误差随机测量误差在收集资料过程中,由于各种偶然因素的影响而造成同一对在收集资料过程中,由于各种偶然因素的影响而造成同一对象多次测定结果的不完全一致。这种误差往往没有固定的倾象多次测定结果的不完全一致。这种误差往往没有固定的倾向,有时高有时低,被称为随机测量误差。向,有时高有时低,被称为随机测量误差。抽样误差抽样误差个体之间存在变异,而抽样有时只能抽去总体中的一小部

10、分个体之间存在变异,而抽样有时只能抽去总体中的一小部分作为样本。作为样本。2024/7/2713概概 率率概率是描述某一事件发生的可能性大小的一个量度。概率是描述某一事件发生的可能性大小的一个量度。用用A表示某一事件,表示某一事件,P表示该事件可能发生的概率。表示该事件可能发生的概率。在一定条件下,肯定发生的事件称为必然事件,概率在一定条件下,肯定发生的事件称为必然事件,概率为为1;肯定不发生的事件称为不可能事件,概率为;肯定不发生的事件称为不可能事件,概率为0;可能发生也可能不发生的事件称为随机事件或偶然事可能发生也可能不发生的事件称为随机事件或偶然事件,其概率介于件,其概率介于0与与1之间

11、。之间。在统计学上,习惯将在统计学上,习惯将P0.05或或P 0.01称为小概率事件,称为小概率事件,表示该事件发生的可能性很小。表示该事件发生的可能性很小。在医学研究中,常把在医学研究中,常把P 0.05作为事物差别有统计学意作为事物差别有统计学意义义, P 0.01作为事物差别有高度统计学意义的界限作为事物差别有高度统计学意义的界限.2024/7/2714第二章第二章 集中趋势与离散趋势的统计描述集中趋势与离散趋势的统计描述第一节第一节 集中趋势的描述统计集中趋势的描述统计这一部分的主要内容涉及统计图表和描述平均水平这一部分的主要内容涉及统计图表和描述平均水平和集中趋势的统计量,目的在于有

12、效地组织、整理和集中趋势的统计量,目的在于有效地组织、整理和表现统计资料的信息。和表现统计资料的信息。第二节第二节 离散趋势的描述统计离散趋势的描述统计衡量变异程度大小的指标有多种,但大体可以分为衡量变异程度大小的指标有多种,但大体可以分为两类:一类是按间距计算,有极差和四分位数间距;两类:一类是按间距计算,有极差和四分位数间距;另一类则按平均差距计算,有离均差平方和、均方另一类则按平均差距计算,有离均差平方和、均方差、标准差和变异系数等。差、标准差和变异系数等。2024/7/2715第一节第一节 集中趋势的描述统计集中趋势的描述统计频率分布频率分布平均数平均数算术均数算术均数几何均数几何均数

13、中位数中位数百分位数百分位数2024/7/2716频率分布频率分布类型类型频率表频率表直方图直方图用途用途作为陈述资料的形式,可以代替繁复的原始资料,作为陈述资料的形式,可以代替繁复的原始资料,便于进一步分析。便于进一步分析。便于观察数据的分布类型。便于观察数据的分布类型。便于发现资料中某些远离群体的特大或特小的可疑便于发现资料中某些远离群体的特大或特小的可疑值。值。当样本含量比较大时,可用各组段的频率作为概率当样本含量比较大时,可用各组段的频率作为概率的估计值。的估计值。2024/7/2717算术均数算术均数 直接法直接法加权法加权法2024/7/2718几何均数几何均数通用式:通用式:直接

14、法:直接法:分组法:分组法:2024/7/2719中位数中位数直接法直接法当观察例数为奇数时:当观察例数为奇数时:M = XM = X(n+1n+1)/2/2当观察例数为偶数时:当观察例数为偶数时:M = M = (X Xn/2n/2+X+Xn/2+1n/2+1)分组法分组法其中其中L L、i iM M、f fM M、分别为所在组段的下限、组距和频数,、分别为所在组段的下限、组距和频数,f fL L为为M M所在组之前各组段的累积频数。所在组之前各组段的累积频数。2024/7/2720百分位数百分位数百分位数用符号百分位数用符号Px表示,表示,x即百分位,所谓百分位数即百分位,所谓百分位数Px

15、是指在一组数据中找到这样一个值,全部观察值的是指在一组数据中找到这样一个值,全部观察值的x%小于小于Px,而其余(,而其余(100-x)%大于大于Px。其中其中L L、ixix、fxfx、分别为、分别为PxPx所在组段的下限、组距和频所在组段的下限、组距和频数,数,f fL L为为PxPx所在组之前各组段的累积频数。所在组之前各组段的累积频数。2024/7/2721第二节第二节 离散趋势的统计描述离散趋势的统计描述极差和四分位数间距极差和四分位数间距平均偏差平均偏差离均差平方离均差平方方差方差标准差标准差变异系数变异系数2024/7/2722积差和四分位数间距积差和四分位数间距积差积差也称全距

16、,即一组观察值中最大值和最小值之差,也称全距,即一组观察值中最大值和最小值之差,符号为符号为R R,是变异指标中最简单的一种。,是变异指标中最简单的一种。四分位数间距四分位数间距将所有的观察值排序后,分成四个数目相等的段落,将所有的观察值排序后,分成四个数目相等的段落,每个段落的观察值数目各占总例数的每个段落的观察值数目各占总例数的25%25%,去掉两,去掉两端的端的25%25%,取中间,取中间50%50%观察值的数值范围即为四分位观察值的数值范围即为四分位数间距。数间距。四分位数间距用符号四分位数间距用符号Q Q表示,它可以通过计算百分表示,它可以通过计算百分位数位数P P7575和和P P

17、2525之差得到,即之差得到,即Q=PQ=P7575-P-P25252024/7/2723平均偏差平均偏差计算各观察值偏离平均数的平均差距,为了避免正负抵消,将每个观察值与均数之差的绝对值相加,然后取平均,称作平均偏差,它可以表示为:平均偏差是一个很直观的变异量度,但由于用了绝对值,在数学上不便于继续处理,使它在应用上受到很大限制,实际中很少使用。2024/7/2724离均差平方和离均差平方和为了克服平均偏差使用绝对值不便进一步运算的缺点,可以不通过取绝对值,而是通过取平方来避免正负抵消,即使用离均差平方和,其公式为:它描述了每个观察值相对于集中位置“均数”的分散程度。通过计算可化为下式:20

18、24/7/2725方方 差差将离均差平方和再取平均,其结果称作均方差,将离均差平方和再取平均,其结果称作均方差,简称方差。简称方差。需要注意的是,对于样本资料,在对离均差平需要注意的是,对于样本资料,在对离均差平方和取平均时分母用方和取平均时分母用n-1代替代替n,于是有:,于是有:式中式中s2为样本方差,分母为样本方差,分母n-1称为自由度。称为自由度。2024/7/2726标准差标准差在统计分析中为了方便,通常将方差取平方根,在统计分析中为了方便,通常将方差取平方根,还原成与原始观察值单位相同的变异量度,即还原成与原始观察值单位相同的变异量度,即标准差,计算公式如下:标准差,计算公式如下:

19、也可写为:也可写为:2024/7/2727变异系数变异系数在两组数据的均数相差不大,单位也相同时,从标准差的大小就可以直接比较两个样本的变异程度。当均数相差较大或单位不同的几组观察值的变异程度进行比较时,标准差就不适宜了,在这种情况下可以使用变异系数,其计算公式为:2024/7/2728第三章第三章 t 检验检验第一节第一节 假设检验的意义和步骤假设检验的意义和步骤第二节第二节 单个样本单个样本 t 检验检验第三节第三节 配对样本配对样本 t 检验检验第四节第四节 两独立样本两独立样本 t 检验检验2024/7/2729第一节第一节 检验假设的意义和步骤检验假设的意义和步骤检验假设的基本概念检

20、验假设的基本概念检验假设是对估计的总体首先提出一个假设,然后通过样本检验假设是对估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设。如果拒绝,认为该样本很可数据去推断是否拒绝这一假设。如果拒绝,认为该样本很可能不是来自这个总体;否则,很可能来自这个总体。能不是来自这个总体;否则,很可能来自这个总体。建立检验假设和确定检验水平建立检验假设和确定检验水平假设:无效假设(假设:无效假设(H0) / 被择假设(被择假设(H1) 检验水平:检验水平:选择检验方法和统计推断分析选择检验方法和统计推断分析选择检验方法和计算检验统计量选择检验方法和计算检验统计量确定确定P值和作出统计推断结论值

21、和作出统计推断结论2024/7/2730第二节第二节 单个样本单个样本 t 检验(检验(1)例:根据大量调查,已知健康成年男子例:根据大量调查,已知健康成年男子的脉搏均数为的脉搏均数为72次次/分,某医生在某山区分,某医生在某山区随机调查随机调查30名健康男子,求得脉搏均数名健康男子,求得脉搏均数为为74.2次次/分,标准差为分,标准差为6.5次次/分。能否认分。能否认为该山区的成年男子的脉搏均数高于一为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?般成年男子的脉搏均数?2024/7/2731第二节第二节 单个样本单个样本 t 检验(检验(2)建立检验假设,确定检验水平建立检验假设,确

22、定检验水平H0:=0H1; 0=0.05计算检验统计量计算检验统计量确定确定P值,做出推断结论值,做出推断结论本例自由度本例自由度v30-1=29查附表得查附表得t0.05(29)=2.045今今t0.05, 无统计学意义无统计学意义2024/7/2732第三节第三节 配对样本配对样本 t 检验(检验(1)将受试对象按某些重要特征相近的原则配成对子,每对中的两个将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理,称为随机配对设计。个体随机地给予两种处理,称为随机配对设计。配对设计资料主要有三种情况:配对设计资料主要有三种情况:两种同质受试对象分别接受两种处理;两种同

23、质受试对象分别接受两种处理;同一受试或同一样本的两个部分,分别接受两种不同处理;同一受试或同一样本的两个部分,分别接受两种不同处理;同一受试对象处理(实验或治疗)前后的结果比较。同一受试对象处理(实验或治疗)前后的结果比较。配对设计的检验统计量为:配对设计的检验统计量为:2024/7/2733第三节第三节 配对样本配对样本 t 检验(检验(2)例:有例:有12名接种卡介苗的儿童,八周后用两批不同的结核菌素,名接种卡介苗的儿童,八周后用两批不同的结核菌素,一批是标准结核菌素,一批是新制结核菌素,分别注射在儿童的一批是标准结核菌素,一批是新制结核菌素,分别注射在儿童的前臂,问两种结核菌素的皮肤浸润

24、反应性有无差别?前臂,问两种结核菌素的皮肤浸润反应性有无差别? 编号编号 标准品标准品 新制品新制品 差值差值d d2 1 12.0 10.0 2.0 4.00 2 14.5 10.0 4.5 20.25 3 15.5 12.5 3.0 9.00 . . . . . 12 10.5 9.5 1.0 1.00 合合 计计 39 1952024/7/2734第三节第三节 配对样本配对样本 t 检验(检验(3)建立检验假设,确定检验水平建立检验假设,确定检验水平H0:d=0H1;d 0=0.05计算检验统计量计算检验统计量确定确定P值,做出推断结论值,做出推断结论自由度自由度v-12-1=11, t

25、0.05(11)=2.201 t0.01(11)=3.106本例本例 t t0.01(11),),Pt0.05(23)=2.069,PF0.05(11,12),Pt0.05, P F0.01(2,33), P0.05故按故按=0.05水平拒绝水平拒绝H0,接受,接受H1,可以认为三组,可以认为三组NO总体水平不总体水平不同。同。2024/7/2751第第2节节 随机区组设计的方差分析(随机区组设计的方差分析(1)随机区组设计的方差分析表随机区组设计的方差分析表变异来源 平方和 自由度 均方 F 总变异 N-1 因素A c-1 SSA/(r-1) MSA/MSe 因素B r-1 SSB/(r-1

26、) MSB/MSe 误差 (c-1)(r-1) SSe/e其中校正项2024/7/2752第第2节节 随机区组设计的方差分析(随机区组设计的方差分析(2)例例: 将将36只雌性大白鼠按月龄相同、体重接近分为只雌性大白鼠按月龄相同、体重接近分为12组组, 经一段时间注射经一段时间注射不同剂量雌激素后的子宫质量见下表。试问:不同剂量雌激素后的子宫质量见下表。试问:1.不同组的大鼠间子宫质不同组的大鼠间子宫质量是否相同?量是否相同?2.接受不同剂量注射的大鼠子宫质量是否相同?接受不同剂量注射的大鼠子宫质量是否相同? 区区 组组 0.2 0.4 0.8 合计合计 1 83 100 109 292 2

27、64 78 111 253 3 69 79 149 297 . 12 62 106 114 282 合计合计 794 1092 1537 34232024/7/2753 第第2节节 随机区组设计的方差分析(随机区组设计的方差分析(3)建立检验假设建立检验假设(1) H0:1=2=3 H1:i(i=1,2,3)不同剂量组间不完全相同)不同剂量组间不完全相同(2) H0:1= 2= 3 H1:i(i=1,2,3)不同种属间不完全相同)不同种属间不完全相同计算统计量计算统计量2024/7/2754 第第2节节 随机区组设计的方差分析(随机区组设计的方差分析(4)方差分析表方差分析表 变异来源变异来源

28、 平方和平方和 自由度自由度 均方均方 F 总变异总变异 29274.75 35 不同剂量间不同剂量间 23302.1667 2 11651.0833 53.4769不同区组间不同区组间 1179.4167 11 107.2197 0.4921 误差误差 4793.1667 22 217.8712对关于剂量分组的假设,查附表,对关于剂量分组的假设,查附表,F0.05(2,22)=3.4453.4769, P0.4921, P0.05。按按=0.05水平不能拒绝水平不能拒绝H0。2024/7/2755第三节第三节 多个样本均数的多重比较多个样本均数的多重比较q检验法检验法用于对多个样本均数每两个

29、作比较,检验统计量为:用于对多个样本均数每两个作比较,检验统计量为:式中式中 为两个对比组的样本均数,为两个对比组的样本均数,Mse是方差分是方差分析中的误差均方(或组内均方),析中的误差均方(或组内均方),nA、nB为两对比组为两对比组的样本例数,的样本例数,e为方差分析中误差均方的自由度。为方差分析中误差均方的自由度。2024/7/2756第五章第五章 卡方检验卡方检验第一节第一节 22表卡方检验表卡方检验第二节第二节 行行列表卡方检验列表卡方检验第三节第三节 配对资料卡方检验配对资料卡方检验2024/7/2757第一节第一节 22表卡方检验表卡方检验四格表卡方检验四格表卡方检验四格表资料

30、卡方检验的连续性校正四格表资料卡方检验的连续性校正四格表卡方检验的精确概率检验法(略)四格表卡方检验的精确概率检验法(略)2024/7/2758四个表卡方检验(四个表卡方检验(1)使用卡方检验的基本公式使用卡方检验的基本公式卡方检验的基本公式为:卡方检验的基本公式为:这里这里R是是Row(行)的字头,(行)的字头,C是是Column(列)的字(列)的字头,头,ARC是位于是位于R行行C列交叉处的实际频数,列交叉处的实际频数,TRC是位是位于于R行行C列交叉处的理论频数。列交叉处的理论频数。nR是是ARC所在的行的合计,所在的行的合计,nC是是ARC所在列的合计,所在列的合计,n是多个样本例数的

31、合计。是多个样本例数的合计。2024/7/2759四个表卡方检验(四个表卡方检验(2)例:某药品检验所随机抽取例:某药品检验所随机抽取574名成年人,研究某抗生名成年人,研究某抗生素的耐药性。其中素的耐药性。其中179例未曾使用该抗生素,其耐药率例未曾使用该抗生素,其耐药率为为40.78%;而在;而在395例曾使用过该药的人群中,耐药率例曾使用过该药的人群中,耐药率为为45.57%,试问两种人群的耐药率是否一样?,试问两种人群的耐药率是否一样? 用药史用药史 不敏感不敏感 敏感敏感 合计合计 耐药率(耐药率(%)曾服该药曾服该药 180 215 395 45.57未服该药未服该药 73 106

32、 179 40.78 合计合计 253 321 574 44.082024/7/2760四个表卡方检验(四个表卡方检验(3)建立检验假设建立检验假设H0:两种人群对该抗生素的耐药率相同,即:两种人群对该抗生素的耐药率相同,即1=2H1:两种人群对该抗生素的耐药率不相同,即:两种人群对该抗生素的耐药率不相同,即12计算检验统计量计算检验统计量查表及统计推断查表及统计推断20.05(1)=3.84,本例,本例 20.05在在=0.05的检验水准下,接受的检验水准下,接受H0 。2024/7/2761四个表卡方检验(四个表卡方检验(4) 四格表资料四格表资料 2检验专用公式检验专用公式 22表格式表

33、格式 B1 B2 合计合计 A1 a b a+b A2 c d c+d a+c b+d n=a+b+c+d2024/7/2762四格表资料卡方检验的连续性校正(四格表资料卡方检验的连续性校正(1)在四个表资料中,当在四个表资料中,当n40且某一理论值且某一理论值1T5时,须对时,须对 2值进行连续性效正。值进行连续性效正。2024/7/2763 四格表资料卡方检验的连续性校正(四格表资料卡方检验的连续性校正(2)例:某医学院抽样调查大学四年级和五年级的学生近例:某医学院抽样调查大学四年级和五年级的学生近视眼患病情况,四年级学生的近视率为视眼患病情况,四年级学生的近视率为7.14%,五年级,五年

34、级学生的近视率为学生的近视率为35.71%,试问大学四年级与五年级学,试问大学四年级与五年级学生的近视率是否一样?生的近视率是否一样? 年级年级 近视近视 非近视非近视 合计合计 近视率近视率(%)四年级四年级 2(4.67) 26(23.33) 28 7.14五年级五年级 5(2.33) 9(11.69) 14 35.71 合计合计 7 35 42 16.672024/7/2764 四格表资料卡方检验的连续性校正(四格表资料卡方检验的连续性校正(2)建立检验假设建立检验假设H0:四年级与五年级学生的近视眼率相同,即:四年级与五年级学生的近视眼率相同,即1=2H1:四年级与五年级学生的近视眼率

35、不相同,即:四年级与五年级学生的近视眼率不相同,即12计算检验统计量计算检验统计量查表及统计推断查表及统计推断20.05(1)=3.84,本例,本例 20.05在在=0.05的检验水准下,接受的检验水准下,接受H0 。2024/7/2765四表格卡方检验的确切概率计算法四表格卡方检验的确切概率计算法在四表格的卡方检验中,若遇到总例数在四表格的卡方检验中,若遇到总例数n40,或有理,或有理论值论值T20.05(2) ,P0.05,拒绝,拒绝H0。但究竟哪两组之间的有效。但究竟哪两组之间的有效率有差别,须进一步作两两组间率的比较。率有差别,须进一步作两两组间率的比较。2024/7/2769多个实验

36、组间的两两比较(多个实验组间的两两比较(2)西药与中药治疗肝炎疗效比较西药与中药治疗肝炎疗效比较 组组 别别 有效有效 无效无效 合计合计 有效率(有效率(%) 西药组西药组 51 49 100 51.00 中药组中药组 35 45 80 43.75 合合 计计 86 94 180 47.78查表查表20.05(1)=3.84,而,而20.050.017,在,在0.017的的水平下不拒绝水平下不拒绝H0。2024/7/2770多个实验组间的两两比较(多个实验组间的两两比较(3)西药与中西药结合治疗肝炎疗效比较西药与中西药结合治疗肝炎疗效比较 组组 别别 有效有效 无效无效 合计合计 有效率(有

37、效率(%) 西药组西药组 51 49 100 51.00中西药结合中西药结合 59 15 74 79.73 合合 计计 110 64 174 63.22查表查表20.01(1)=6.63,而,而220.01(1),则,则P0.01 20.01(1),则,则P0.0120.05(2),P 20.01(1),则,则P0.01 20.01(1),则,则P0.01 20.01(1),则,则P0.010.017,在,在0.017的的水平下拒绝水平下拒绝H0。2024/7/2776第三节第三节 配对资料卡方检验(配对资料卡方检验(1)基本公式:校正公式:当观察频数b+c40时,需要对2进行校正。2024/

38、7/2777第三节第三节 配对资料卡方检验(配对资料卡方检验(2)例;在下列资料中,例;在下列资料中,A培养基的阳性培养率为培养基的阳性培养率为36.36%,B培养基的阳性培养率为培养基的阳性培养率为34.345,试问,试问A、B两种培两种培养基的阳性培养率是否相同?养基的阳性培养率是否相同?两种培养基的培养结果两种培养基的培养结果 A培养基培养基 B培养基培养基 合计合计 + + 48(a) 24(b) 72 20(c) 106(d) 126 68 130 1982024/7/2778第三节第三节 配对资料卡方检验(配对资料卡方检验(3)建立检验假设建立检验假设H0:两种培养基的阳性检出率相

39、等:两种培养基的阳性检出率相等H1:两种培养基的阳性检出率不等:两种培养基的阳性检出率不等计算检验统计量计算检验统计量查表及统计推断查表及统计推断20.05(1)=3.84,本例,本例 20.05在在=0.05的检验水准下,接受的检验水准下,接受H0 。2024/7/2779第六章第六章 非参数检验方法非参数检验方法第一节第一节 配对资料的秩和检验配对资料的秩和检验第二节第二节 两样本比较的秩和检验两样本比较的秩和检验第三节第三节 多个样本比较的秩和检验多个样本比较的秩和检验2024/7/2780第一节第一节 配对资料的秩和检验(配对资料的秩和检验(1)一一 般般 步步 骤骤求出各对数据的差值

40、求出各对数据的差值建立检验假设建立检验假设编秩次,求秩和编秩次,求秩和依差值绝对值,从大到小排秩,并按差值的正负,标上正负依差值绝对值,从大到小排秩,并按差值的正负,标上正负号;号;编秩时,对正负号不同的差数中,若有绝对值相等时,则取编秩时,对正负号不同的差数中,若有绝对值相等时,则取其平均秩次;其平均秩次;分别求正负秩次之和分别求正负秩次之和T+与与T,并以绝对值较小者为统计量,并以绝对值较小者为统计量T值。值。查表,确定查表,确定P值范围值范围当当n25时,可查附表的时,可查附表的T界值表,界值表,T越小,越小,P越小。越小。当当n25时,可按近似正态分布用时,可按近似正态分布用u检验,其

41、公式为:检验,其公式为: 2024/7/2781第一节第一节 配对资料的秩和检验(配对资料的秩和检验(2)例:临床某医生研究白癜风病人的例:临床某医生研究白癜风病人的IL-6指标在白癜风部位与正常指标在白癜风部位与正常部位有无差异,调查的资料如下:部位有无差异,调查的资料如下: 病人号病人号 白斑部位白斑部位 正常部位正常部位 d=正常正常-白斑白斑 秩次秩次 1 40.03 88.57 48.54 6 2 91.13 88.00 -17.13 -3 3 80.32 123.72 43.40 4 4 25.32 39.03 13.71 2 5 19.61 24.37 4.76 1 6 14.5

42、0 92.75 78.25 8 7 49.63 121.57 71.94 7 8 44.56 89.76 45.20 5 合计合计 T+=33 T=32024/7/2782第一节第一节 配对资料的秩和检验(配对资料的秩和检验(3)建立检验假设建立检验假设H0:差值总体的中位数为:差值总体的中位数为0H1:差值总体的中位数不为:差值总体的中位数不为0计算统计量计算统计量首先计算每个对子的差值首先计算每个对子的差值d ,根据,根据8个个d 的绝对值,由小到大的绝对值,由小到大排秩,并根据排秩,并根据d 的正负号给予正负号。然后分别相加正负秩次,的正负号给予正负号。然后分别相加正负秩次,得到得到T+

43、=33 ,T=3,取较小者为统计量,取较小者为统计量T= T=3。查表及结论查表及结论现现n=8,查,查T值表值表T0.05(8)=333,T=3恰好落在界点上,所以恰好落在界点上,所以P0.05,按,按=0.05水准拒绝水准拒绝H0,可认为白斑部位与正常部位的可认为白斑部位与正常部位的白介素有差异。白介素有差异。2024/7/2783第二节第二节 两样本比较的秩和检验(两样本比较的秩和检验(1)一一 般般 步步 骤骤建立检验假设建立检验假设编秩号,求秩和编秩号,求秩和两样本观察值从小到大混合编秩;两样本观察值从小到大混合编秩;设设n1与与n2分别为两样本的含量,规定分别为两样本的含量,规定n

44、1n2,含量为,含量为n1组的秩组的秩和和T1为统计量为统计量T值。值。确定确定P值值当当n1159,超,超出范围,出范围,P 20.05(3), P0.05, 按按=0.05水准拒绝水准拒绝H0,接受,接受H1,故认为四组,故认为四组DNA含量有差别。含量有差别。2024/7/2789第七章第七章 相关与回归相关与回归第一节第一节 线性相关线性相关第二节第二节 线性回归线性回归第三节第三节 线性相关与回归的区别与联系线性相关与回归的区别与联系第四节第四节 等级相关等级相关2024/7/2790第一节第一节 线性相关(线性相关(1)相关系数的计算方法相关系数的计算方法皮尔森(皮尔森(Pears

45、on)相关法)相关法原始分数计算法原始分数计算法2024/7/2791第一节第一节 线性相关(线性相关(2)例:从某大学生群体中随机抽取例:从某大学生群体中随机抽取12名女大学生组成样名女大学生组成样本,分别测得每个学生得身高和体重,试计算身高与本,分别测得每个学生得身高和体重,试计算身高与体重之间的相关系数。体重之间的相关系数。编号编号 身高身高(cm) 体重体重(kg) XY X2 Y2 1 152 51 7752 23104 2601 2 158 46 7268 24964 2116 3 167 55 9185 27889 3025 . . . . . . . . . . . . 12

46、164 55 9020 26896 3025合计合计 1998 693 115885 333470 404692024/7/2792第一节第一节 线性相关(线性相关(3)解:解:这里这里r为正值,表示身高与体重呈现正的相关。为正值,表示身高与体重呈现正的相关。2024/7/2793第一节第一节 线性相关(线性相关(4)线性相关系数的检验假设线性相关系数的检验假设直接查表法直接查表法n=12,r=0.8342,自由度,自由度=12-2=10查附表,查附表,r0.001(10)=0.823,故,故Pt0.001(10),),P0.001, 结果与查结果与查r值表一致。值表一致。2024/7/279

47、4第二节第二节 线性回归(线性回归(1)线性回归方程的计算线性回归方程的计算其中:其中:2024/7/2795第二节第二节 线性回归(线性回归(1)例:有人研究了温度对蛙的心率的影响,建立了下表例:有人研究了温度对蛙的心率的影响,建立了下表所示的资料,试进行回归分析。所示的资料,试进行回归分析。对象对象 温度(温度(X) 心率(心率(Y) XY X2 Y2 1 2 5 10 4 25 2 4 11 44 16 121 3 6 11 66 36 121 . . . . . . 9 18 32 576 324 1024合计合计 90 179 2216 1140 43652024/7/2796第二节

48、第二节 线性回归(线性回归(2)在本例中在本例中带入公式得:带入公式得:则回归方程为:则回归方程为:2024/7/2797第三节第三节 线性相关与回归的区别与联系线性相关与回归的区别与联系区别区别线性相关表示两个变量之间的相互关系是双向的,线性相关表示两个变量之间的相互关系是双向的,回归则反映两个变量之间的单向关系。回归则反映两个变量之间的单向关系。联系联系如果对同一资料进行相关与回归分析,则得到的相如果对同一资料进行相关与回归分析,则得到的相关系数关系数r与回归方程中的与回归方程中的b正负号是相同的;正负号是相同的;相关回归可以互相解释。相关回归可以互相解释。2024/7/2798第四节第四

49、节 等级相关(等级相关(1)如果观测资料是等级资料,则可用等级相如果观测资料是等级资料,则可用等级相关来表示两事物之间的关系。常用的等级关来表示两事物之间的关系。常用的等级相关方法为相关方法为Spearman等级相关,其计算等级相关,其计算公式为:公式为:2024/7/2799第四节第四节 等级相关(等级相关(2)例;某医生做了一种研究,欲了解人群中氟骨症患病率与饮水之例;某医生做了一种研究,欲了解人群中氟骨症患病率与饮水之间的关系,结果见下表,试计算等级相关系数。间的关系,结果见下表,试计算等级相关系数。地区编号地区编号 饮水中氟含量饮水中氟含量 氟骨症患病率氟骨症患病率 d d2 X 秩次秩次 Y 秩次秩次 1 0.48 1 22.37 2 -1 1 2 0.64 2 23.31 3 -1 1 3 1.00 3 25.32 4 -1 1 4 1.47 4 22.29 1 3 9 5 1.60 5 35.00 5.5 -0.5 0.25 6 2.86 6 35.00 5.5 0.5 0.25 7 3.21 7 46.07 7 0 0 8 4.71 8 48.31 8 0 02024/7/27100第四节第四节 等级相关(等级相关(3)将将X、Y分别从小到大编秩,若遇到相同分别从小到大编秩,若遇到相同观测值时,则取平均秩次;观测值时,则取平均秩次;计算计算d2和和计算计算rs

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号