医学统计学:05-假设检验基础(2015研)

上传人:pu****.1 文档编号:590779480 上传时间:2024-09-15 格式:PPT 页数:71 大小:2.94MB
返回 下载 相关 举报
医学统计学:05-假设检验基础(2015研)_第1页
第1页 / 共71页
医学统计学:05-假设检验基础(2015研)_第2页
第2页 / 共71页
医学统计学:05-假设检验基础(2015研)_第3页
第3页 / 共71页
医学统计学:05-假设检验基础(2015研)_第4页
第4页 / 共71页
医学统计学:05-假设检验基础(2015研)_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《医学统计学:05-假设检验基础(2015研)》由会员分享,可在线阅读,更多相关《医学统计学:05-假设检验基础(2015研)(71页珍藏版)》请在金锄头文库上搜索。

1、5 5 假假设设检检验验引子引子 : 1. 医学科学研究的特点医学科学研究的特点 医学统计学的任务医学统计学的任务普普 查:查:直接得到关于总体的认直接得到关于总体的认知,不需要统计推断。知,不需要统计推断。抽样调查抽样调查抽样误差抽样误差参数估计参数估计假设检验假设检验风风 险险假假设设检检验验的的基基础础n 假设检验的基本思想假设检验的基本思想n 假设检验的步骤假设检验的步骤n 单组样本资料的假设检验单组样本资料的假设检验 n 假设检验的两类错误假设检验的两类错误n假设检验的几个观点假设检验的几个观点【例例5-1】 某一般中学男生的心率平均值某一般中学男生的心率平均值0=75次次/分,标准

2、分,标准差差= 5.0次次/分(大规模调查获得);我们通分(大规模调查获得);我们通 过抽过抽样调查,获得经常参加体育锻炼的某中学样调查,获得经常参加体育锻炼的某中学100名男名男生的心率平均值为生的心率平均值为 ; 问:问:经常参加体育锻炼的男生心率是否与一般中经常参加体育锻炼的男生心率是否与一般中学男生的不同?学男生的不同?未知总体未知总体第二种可能性:第二种可能性:已知总体已知总体样本均数与拟比较的总体均数不等有两种可能:样本均数与拟比较的总体均数不等有两种可能:抽样误差抽样误差本质差异本质差异运动的影响运动的影响 n=100第一种可能性:第一种可能性:唯证据原则唯证据原则反证法反证法没

3、有差异没有差异 假设检验假设检验作检验作检验 无罪假设无罪假设 刑事诉讼刑事诉讼找证据找证据 假设检验实质是反证法与概率学小概率理论的假设检验实质是反证法与概率学小概率理论的一个完美结合一个完美结合什么是假设检验?什么是假设检验?假设假设:先预设一种立场,是对总体参数的数值所作的一种陈述先预设一种立场,是对总体参数的数值所作的一种陈述例:认为经常参加体育锻炼的男生心率与一般中学男生例:认为经常参加体育锻炼的男生心率与一般中学男生的没有差异,即的没有差异,即1=;其实质是将样本统计量;其实质是将样本统计量 与已与已知总体均数知总体均数之间差异的原因归结为之间差异的原因归结为抽样误差抽样误差。检验

4、检验:是一种方法,它一定是利用样本提供的信息,从概率的是一种方法,它一定是利用样本提供的信息,从概率的角度来判断这个假设是正确的(是抽样误造成的)?还角度来判断这个假设是正确的(是抽样误造成的)?还是错误的(不是抽样误差造成的)?是错误的(不是抽样误差造成的)?下结论下结论H0:零假设零假设t 界值t 分布图,分布图, =25 /2/2 /2/2-t 界值根据根据P 值,得出结论值,得出结论H1:备择假设备择假设验验证证假假设设建建立立假假设设下下结结论论检验统计量检验统计量预设预设=0.05P 值值三个重要概念:三个重要概念:n 检验水准检验水准n 检验统计量检验统计量n 概率概率P值值1.

5、 小概率事件原则和检验水准小概率事件原则和检验水准 小概率事件小概率事件检验水准检验水准 -(level of test)n是一个概率值;在假设检验中,定义是一个概率值;在假设检验中,定义发生概率发生概率 的事件叫的事件叫小概率事件小概率事件,将,将称为称为检验水准;检验水准;n应事先确定应事先确定,一般取值一般取值0.05或或0.01。n选选为为0.05只是一种习惯,而不是绝只是一种习惯,而不是绝对的标准。对的标准。 概率概率2. 检验统计量:检验统计量:n检验统计量是利用检验统计量是利用样本数据的多种信息,样本数据的多种信息,计算得到的计算得到的一个综合指标一个综合指标;它可以反应该样本可

6、能存在;它可以反应该样本可能存在抽样误差抽样误差的大小,从而成为决定是否可以拒绝的大小,从而成为决定是否可以拒绝H0的证据。的证据。n在零假设情况下,统计量服从一个给定的概率分布在零假设情况下,统计量服从一个给定的概率分布(如(如t分布、分布、F分布和分布和 分布等分布等 )。)。n如果如果算出的检验统计量取值落在该分布的临界值之外,算出的检验统计量取值落在该分布的临界值之外,则可认为该零假设的成立是个小概率事件则可认为该零假设的成立是个小概率事件,可下拒绝,可下拒绝H0的决定。而且,该检验统计量的绝对值越大,拒绝的决定。而且,该检验统计量的绝对值越大,拒绝H0的理由越充分,反之不拒绝的理由越

7、充分,反之不拒绝H0的理由越充分。的理由越充分。3. 概率概率P 值值:就是根据抽样分布的规律,:就是根据抽样分布的规律,由由H0所规定所规定的总体中作一次随机抽样,实际中得到的总体中作一次随机抽样,实际中得到目目前这个样本,甚至包括比这个更偏、更极前这个样本,甚至包括比这个更偏、更极端样本的端样本的累积可能性累积可能性。 换言之:在换言之:在H0 成立的前提下,出现目前成立的前提下,出现目前检验统计量及更不利于检验统计量及更不利于H0成立的统计量的成立的统计量的累积概率,也就是累积概率,也就是H0成立的概率。成立的概率。假设检验的假设检验的 P 值值PP-t 界值界值t 界值界值P 关于假设

8、检验的几个观点关于假设检验的几个观点 根据根据P 值下结论:值下结论:n当当P 时,则结论为:按检验水准时,则结论为:按检验水准拒绝拒绝 H0,接受接受 H1,认为差异有统计学意义(统计结论),认为差异有统计学意义(统计结论),可认为可认为不不同或同或*取值高于取值高于#的(专业结论);的(专业结论); n当当P 时,时,则结论为:按检验水准则结论为:按检验水准不拒绝不拒绝H0,认为差,认为差异无统计学意义(统计结论),异无统计学意义(统计结论),还不能认为还不能认为不同或不同或*取值高于取值高于#(专业结论)。(专业结论)。 “不拒绝不拒绝H0”只因为此时拒绝只因为此时拒绝H0的证据不足,绝

9、不的证据不足,绝不等同于接受等同于接受H0。所以下结论时。所以下结论时对对H0只能说只能说“拒绝拒绝”或或“不拒绝不拒绝”,而而对对H1只能说只能说“接受接受”。n假设检验的结果只能说明假设检验的结果只能说明有无统计学意义有无统计学意义(statistical significance),而不能说明),而不能说明专业上的差异大小专业上的差异大小:P 值值越小只能说明,作出拒绝越小只能说明,作出拒绝 H0,接受,接受 H1的的统计学证据统计学证据越充份,越充份,推论时推论时犯错误的机会越小;犯错误的机会越小;而与专业上而与专业上 1 1- -2 2 的大小无直接关系。的大小无直接关系。n当当P值

10、接近于值接近于值时,下结论应尤其慎重。值时,下结论应尤其慎重。5.2 假设检验的步骤建立假设,确定检验水准及单双侧建立假设,确定检验水准及单双侧确定确定P值值计算检验统计量计算检验统计量作推断结论作推断结论拒绝拒绝H0,接受,接受H1,认为差异有统计学意义认为差异有统计学意义P PP P 不拒绝不拒绝H0,认为差异无统计学意义认为差异无统计学意义假设检验的步骤:假设检验的步骤:u 建立假设建立假设H0、H1 u 确定检验水准确定检验水准u 根据专业知识,确定单、双侧检验根据专业知识,确定单、双侧检验5.2.1 建立假设检验,确定检验水准:建立假设检验,确定检验水准: 什么是什么是零假设零假设

11、(Null Hypothesis) ? (1)一般是作)一般是作没有差别没有差别的假设,又称的假设,又称“原假设原假设”或或“无效假设无效假设” ,表示为,表示为 H0,即,即 H0: = 某一数值,如某一数值,如 = 0(2) 该假设将差异的原因归结为该假设将差异的原因归结为抽样误差抽样误差1. 建立假设:提出无效假设和备择假设建立假设:提出无效假设和备择假设 什么是什么是备择假设备择假设 (Alternative Hypothesis) ? (1)与无效假设相对立)与无效假设相对立有差别有差别的假设,的假设, 由由不等号不等号 , 或或 组成,常表示为组成,常表示为 H1;即;即 H1:

12、某一数值;或某一数值;或 某一数值,某一数值, 某一数值。某一数值。 (2) 该假设将差异的原因归结为该假设将差异的原因归结为环境因素,环境因素,或是一或是一种种本质差异。本质差异。 2. 确定检验水准确定检验水准 由研究者事先确定。由研究者事先确定。 表示为表示为 ,常用的,常用的 值有值有0.01、0.05; 是一个概率值,假设原假设为真时,拒绝原假设的是一个概率值,假设原假设为真时,拒绝原假设的概率,又被称为概率,又被称为抽样分布的拒绝域抽样分布的拒绝域。注意:注意:3. 根据数据特征和专业知识,确定单、双侧根据数据特征和专业知识,确定单、双侧t t 临界值临界值临界值临界值- - t

13、t 临界值临界值临界值临界值问:经常参加锻炼的男生与一般男生心率有何不同?问:经常参加锻炼的男生与一般男生心率有何不同?双侧检验双侧检验:用于推断两总体有无差别时,对两总体:用于推断两总体有无差别时,对两总体间可能存在的两种位置关系均要考虑在内。间可能存在的两种位置关系均要考虑在内。拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域 /2 /2 /2 /2/2 接受域接受域接受域接受域接受域接受域1 - 1 - 1 - t t 临界值临界值临界值临界值问:问:经常参加锻炼的男生经常参加锻炼的男生是否低于一般男生的?是否低于一般男生的?拒绝域拒绝域拒绝域拒绝域接受域接受域接受域接受域接受域接受域1

14、 - 1 - 1 - 2. 单侧检验单侧检验:用于推断两总体有无差别时,仅考虑:用于推断两总体有无差别时,仅考虑两总体间可能存在的两种位置关系的一种。两总体间可能存在的两种位置关系的一种。 n 一般情况下,如结果不明确时,采用双侧假设一般情况下,如结果不明确时,采用双侧假设 H1: 某一数值,某一数值, 如如 0(双侧,包括(双侧,包括 0和和 0 0 两方面)两方面)n如果从专业上能肯定其中一侧是不可能的,则采如果从专业上能肯定其中一侧是不可能的,则采用单侧对立假设用单侧对立假设 H1: 某一数值;如某一数值;如 50?n50?是是单样本单样本t t检验检验否否样本是否来自正态分布总体样本是

15、否来自正态分布总体是是单样本单样本t t检验检验否否单样本秩和检验单样本秩和检验单样本资料差异性比较思路图:单样本资料差异性比较思路图:【例例5-1】 某一般中学男生的心率平均值某一般中学男生的心率平均值0=75次次/分,标准分,标准差差= 5.0次次/分(大规模调查获得);我们通分(大规模调查获得);我们通 过抽过抽样调查,获得经常参加体育锻炼的某中学样调查,获得经常参加体育锻炼的某中学100名男名男生的心率平均值为生的心率平均值为 ; 问:问:经常参加体育锻炼的男生心率是否与一般中经常参加体育锻炼的男生心率是否与一般中学男生的不同?学男生的不同?【案例解析案例解析】n 研究目的:差异性比较

16、研究目的:差异性比较n 资料类型:定量资料资料类型:定量资料n 设计类型:单样本设计设计类型:单样本设计正态性检验正态性检验单样本资料单样本资料Z检验检验该样本来自正态分布的总体该样本来自正态分布的总体 总体标准差已知,总体标准差已知,=5.0H0:= 0H1:0=0.05统计结论统计结论:已知:已知 Z(0.05/2)=1.96,则,则 P 2000时,结果以时,结果以Kolmogorov- Smirnov (D检验检验) 为准为准2.单组样本均数 t 检验:结果输出:两总体均数差及两总体均数差及95%CI用于比较的已知总体均数用于比较的已知总体均数n置信区间回答了置信区间回答了“量量”的问

17、题:即总体均数差在哪的问题:即总体均数差在哪个位置,差异大小是多少;如本题个位置,差异大小是多少;如本题 0.98(0.27,1.70)mg/L 。n而假设检验回答了质的问题:即如果两总体均数间而假设检验回答了质的问题:即如果两总体均数间存在着差异,那么比统计学的角度确认这种差异的存在着差异,那么比统计学的角度确认这种差异的把握度有多大,如本题把握度有多大,如本题 P=0.012。注意:注意: 总体均数差的置信区间总体均数差的置信区间和和 t 检验检验结果是结果是完全一致完全一致性性的,同时这两者又的,同时这两者又互为补充互为补充:【结果报告结果报告】用某仪器测量浓度为用某仪器测量浓度为20m

18、g/L的标准液的标准液11次,得样本次,得样本均数和标准差分别为均数和标准差分别为20.98mg/L、1.068mg/L。经单样本设计资料经单样本设计资料 t 检验,检验, t =3.056,v=10,P=0.012,两总体的均数差及,两总体的均数差及95%CI为为 0.98(0.27,1.70)mg/L;按;按0.05的的 检验水准,拒绝检验水准,拒绝H0,接受,接受H1,认为差异有统计学意义(,认为差异有统计学意义(统计结论统计结论);该仪器测得);该仪器测得的浓度总体上高于标准液,认为该仪器存在着系统误的浓度总体上高于标准液,认为该仪器存在着系统误差(差(专业结论专业结论)。)。变量变换

19、或秩和检验变量变换或秩和检验t 检验检验变量变换或秩和检验变量变换或秩和检验例数例数n =50正态正态偏态偏态两两独独立立样样本本假假设设检检验验单单样样本本配配对对资资料料差值差值正态正态偏态偏态对子数对子数t 检验检验n =50例数例数正态正态偏态偏态n 0 0病人病人1- 1 1漏诊漏诊(假阴性)(假阴性)II 类错误类错误 ( type II error ) )存伪存伪存伪存伪:实事:实事:H0 为假,为假, H1 为真为真检验功效检验功效假设检验中的两类错误:假设检验中的两类错误:两类错误的意义两类错误的意义真实情况真实情况根据样本,作假设检验下的结论根据样本,作假设检验下的结论不拒

20、绝不拒绝H0拒绝拒绝H0H0为真为真推断正确推断正确I 类错误类错误犯错误的概率是犯错误的概率是 ,即检验水准,即检验水准H0为假为假II类错误类错误犯错误的概率是犯错误的概率是 推断正确推断正确 正确的概率是正确的概率是1- ,即检验功效即检验功效1. 第一类错误第一类错误(弃真错误)(弃真错误)拒绝了实际上存在的拒绝了实际上存在的H0第一类错误的概率为第一类错误的概率为 2. 第二类错误第二类错误(纳伪错误)(纳伪错误)不拒绝实际上不存在的不拒绝实际上不存在的H0第二类错误的概率为第二类错误的概率为 n定义:通常把定义:通常把1-,即即拒绝不正确拒绝不正确H0的概率称为的概率称为检验功效检

21、验功效,也称,也称把握度把握度。n 意义是:当两个总体确有差别时,按所规定的意义是:当两个总体确有差别时,按所规定的检验水准检验水准的水平,能发现这种差异的能力。的水平,能发现这种差异的能力。 如如1-=0.80,理论上,理论上100次抽样检验中,平均次抽样检验中,平均有有80次能够得出差别有统计学意义的结论。次能够得出差别有统计学意义的结论。n一般情况下要求一般情况下要求1-在在0.80以上以上。5.4.3 检验功效检验功效(power of test) 由于所建立的检验主要是控制犯由于所建立的检验主要是控制犯I类错误类错误的的概率,而对犯概率,而对犯II类错误的概率类错误的概率却无法直接控

22、制,却无法直接控制,即对一个检验犯即对一个检验犯II类错误的概率究竟怎样无所而类错误的概率究竟怎样无所而知。知。要谨慎对待要谨慎对待 “不拒绝不拒绝H0”的结论的结论 即即“阴性结果阴性结果” 因此,因此,Power值值的大小已成为某些国的大小已成为某些国际会议审查论文设计内容之一;有的已明际会议审查论文设计内容之一;有的已明确规定,若研究者根据确规定,若研究者根据P0.05下阴性结论下阴性结论时,必须提供时,必须提供Power值值。案例分析:见教材案例分析:见教材P89案例案例1、 案例案例2见每章后:常见疑问见每章后:常见疑问案例辨析案例辨析1: 为了比较一种新药与常规药治疗高血压的疗效,

23、为了比较一种新药与常规药治疗高血压的疗效,以血压下降值为疗效指标,有人作了单组设计定量以血压下降值为疗效指标,有人作了单组设计定量资料均数比较的检验,随机抽取资料均数比较的检验,随机抽取25名患者服用了新名患者服用了新药,以常规药的疗效均值为,进行检验,无效假设药,以常规药的疗效均值为,进行检验,无效假设是,对立假设是,检验水平是,对立假设是,检验水平=1%。结果值很大,。结果值很大,拒绝了无效假设。拒绝了无效假设。“拒绝了无效假设拒绝了无效假设”意味着什么意味着什么?下面的说法你认为对吗?下面的说法你认为对吗?说法:说法:(1)你绝对否定了总体均数相等的无效假设。)你绝对否定了总体均数相等的

24、无效假设。 (2)你得到了无效假设为真的概率是)你得到了无效假设为真的概率是1%。 (3)你绝对证明了总体均数不等的备择假设。)你绝对证明了总体均数不等的备择假设。 (4)你能够推论备择假设为真的概率是)你能够推论备择假设为真的概率是99%。 (5)如果你决定拒绝无效假设,你知道你将犯错误)如果你决定拒绝无效假设,你知道你将犯错误的概率是的概率是1%。(6)你得到了一个可靠的发现,假定重复这个实验)你得到了一个可靠的发现,假定重复这个实验许多次,你将有许多次,你将有99%的机会得到具有统计学意的机会得到具有统计学意义的结果。?义的结果。?最佳选择题:最佳选择题:1.统计推断的内容是:统计推断的

25、内容是:A用样本指标推断总体指标用样本指标推断总体指标 B检验统计上的检验统计上的“假设假设”CA、B均不是均不是 DA、B均是均是2.两样本比较时,分别取以下检验水准,下列何者所取两样本比较时,分别取以下检验水准,下列何者所取第二类错误最小:第二类错误最小:A =0.05 B =0.01 C =0.10 D =0.203. 关于假设检验,下列那一项说法是正确的:关于假设检验,下列那一项说法是正确的:A单侧检验优于双侧检验单侧检验优于双侧检验B采用配对采用配对t检验还是两独立样本检验还是两独立样本t 检验是由实验检验是由实验 设计方法决定的设计方法决定的C检验结果若检验结果若P值大于值大于0.

26、05,则接受,则接受H0犯错误的可犯错误的可 能性很小能性很小D用用t 检验进行两样本总体均数比较时,不要求方检验进行两样本总体均数比较时,不要求方 差齐性差齐性简答题:简答题: 1. 什么是一类错误?什么是二类错误?二什么是一类错误?什么是二类错误?二者之间有什么关系?者之间有什么关系? 2. P 与与有什么区别和联系?有什么区别和联系? 3.既然假设检验的结论有可能有错,为什么既然假设检验的结论有可能有错,为什么还要进行假设检验?还要进行假设检验? 答案:答案:P值的大小和值的大小和没有必然关系。没有必然关系。3. P是指是指H0成立的前提下,出现目前样本成立的前提下,出现目前样本数据对应

27、的统计量数值乃至比它更极端数据对应的统计量数值乃至比它更极端数值的概率。数值的概率。是事先确定的检验水准。是事先确定的检验水准。4. 假假设设检检验验中中,无无论论拒拒绝绝不不拒拒绝绝H0,都都可可能能会会犯犯错错误误:表表现现为为拒拒绝绝H0时时,会会犯犯第第一一类类错错误误,不不拒拒绝绝H0时时,会会犯犯第第二二类类错错误误,但但这这并并不不能能否否认认假假设设检检验验 的的 作作 用用 。 .因因为为只只要要涉涉及及到到抽抽样样,就就会会有有抽抽样样误误差差的的存存在在,因因 此此 就就 需需 要要 进进 行行 假假 设设 检检 验验 。 .只只是是要要注注意意假假设设检检验验的的结结论论只只是是个个概概率率性性的的结结论论,它它的的理理论论基基础础是是“小小概概率率事事件件不不太太可可能能原原理理”。 . 练习题:练习题:提 问:THANK YOU!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号