医学6参数估计与假设检验

资源描述

《医学6参数估计与假设检验》由会员分享，可在线阅读，更多相关《医学6参数估计与假设检验（80页珍藏版）》请在金锄头文库上搜索。

1、参数估计与假设检验参数估计与假设检验名人格言大胆假大胆假设，小心求，小心求证。 - -胡适（胡适（ 18911962 ）引例如何研究中国人的身体状况如身高，体重等。姚明-篮球巨星1980年生于上海，身高身高2.26米，曾效力于中国国家篮球队，NBA火箭队。2011年7月退役。被美国时代周刊列入“世界最具影响力100人”。全世界最高和最矮的人吉尼斯世界纪录2010年01月，土耳其27岁的苏坦科森246.5cm全世界最高的人。中国内蒙21岁的何平平74.6cm的全世界最矮的人。第六次全国人口普查第六次全国人口普查2010年11月1日零时为标准时点进行了第六次全国人口普查,全国总人口为13705

2、36875人。其中:0-14岁人口为222459737人，占16.60%15-59岁人口为939616410人，占70.14%60岁及以上人口为177648705人，占13.26%，一. 概论医学研究中,总体常常是非常之大甚至是无限的,无法直接对总体进行研究. 我们采用抽样的方法通过样本提供的信息来对总体进行推断.抽样研究对于无限总体来讲，是唯一可行的方法；对有限总体抽样也可节省人力和材料，增加研究工作的可行性。标准正态分布下尾端概率出现u 小于-1.96及u大于1.96的可能性多大?临界值的表示方法临界值的表示方法将标准正态曲线双侧尾部面积之和等于时对应的正侧变量值称为正态分布的双侧临界

3、值。记为，u 或Z。*有的教材记为 u/2， u1- /2=0.05时， u0.05=1.96正态分布下尾端概率正态分布下去掉双侧尾端概率为5%的范围为多少?统计学思想统计学思想怎样认识无限总体？用有限样本，正常参考值范围，如，舒张压95%正常值范围 60-90 mmHg 收缩压95%正常值范围 90-120 mmHg 怎样认识不确定性事物？概率P 如，有效率，生存率研究总体与样本的关系包括两个方面:一.从总体到样本，这就是研究抽样分布的问题，亦即抽样与抽样误差问题；二.从样本到总体，这就是统计推断问题，它包括两大部分：参数估计和假设检验。二二. .抽抽样与抽与抽样误差差采用从总体中

4、抽取一部分个体组成样本的方法，即抽样方法。样本所得的统计量（如样本均数或率）与总体参数不相同，从同一总体中随机抽取两个样本，其统计量也有差异，这些差异是因抽样产生的，在统计学中称为抽样误差。由于总体中的个体存在差异，有抽样就必然有抽样误差，所以抽样误差是不可避免的。抽样必须遵循随机化原则，否则产生偏倚。三、抽样分布三、抽样分布从总体中随机地抽取若干样本，不同的样本其统计量(如均数、标准差,率)也不相同，因而样本的统计量也是随机变量，也有其概率分布。我们把统计量的概率分布称为抽样分布。下面介绍样本均数的抽样分布。（一）样本均数抽样分布设有一个总体，总体均数为,方差为2，总体中的变量记为

5、x，将此总体称为原始总体。现从这个总体中随机抽取含量为n的样本，样本均数记为。可以设想,我们可以从原总体中，抽出很多个含量为n的样本。由这些样本算得的均数不尽相同，样本均数也是一个随机变量，其概率分布叫做样本均数的抽样分布。抽样举例随机变量x服从均数为3，方差为0.25的正态分布. 在该分布中随机抽取2例组成一个样本，求得其平均值，共抽取100个样本，可得100个平均值。其平均数的概率分布图如下：图5-1 均数的抽样分布N=2例若某大学有学生1万人,其学生的身高服从正态分布X N(175,102)随机抽取n=20人,求其平均身高,反复进行若干次,得其均数的平均值和标准差,均数服从分布:

6、N(175,102/20 )随机抽取n=50人,求其平均身高,反复进行若干次,得其均数的平均值和标准差,均数服从分布: N(175,102/50 )随机抽取n=100人,求其平均身高,反复进行若干次,得其均数的平均值和标准差,均数服从分布: N(175,102/100 ) 统计学已经证明，变量统计学已经证明，变量x x与与变量量的概率的概率分布之分布之间有下面两条性有下面两条性质：1.1.若随机变量若随机变量x x服从正态分布服从正态分布N N(,(,2 2),), x x1,1,x x2,2,x x3 3 x xn n, ,是由是由x x总体得来的随机样本，总体得来的随机样本，则统计量则统

7、计量 =x xn n的概率分布服从正态的概率分布服从正态分布分布N N(,(,2 2n n) )； 2. 2.若随机若随机变量量x x服从均数是服从均数是，方差是，方差是2 2的的非正态分布；非正态分布； x x1,1,x x2,2,x x3 3 , ,是由此总体得是由此总体得来的随机样本，则当样本来的随机样本，则当样本n n相当大时，则相当大时，则统计量统计量 =x xn n的概率分布服从正态分的概率分布服从正态分布布N N(,(,2 2n n) )；这个性质称为中心极限定理这个性质称为中心极限定理中心极限定理中心极限定理中心极限定理告诉我们：不论中心极限定理告诉我们：不论x x变量是连变

8、量是连续型还是离散型，也无论续型还是离散型，也无论x x服从何种分布，服从何种分布，一般只要一般只要n n3030，的分布就近似于正态的分布就近似于正态分布了，这就是为什么正态分布较之其分布了，这就是为什么正态分布较之其它分布应用更为广泛的原因。它分布应用更为广泛的原因。四、标准误四、标准误由样本平均数构成的总体称为样本均数的由样本平均数构成的总体称为样本均数的抽样总体，其均数和标准差分别记为抽样总体，其均数和标准差分别记为和和。是样本均数抽样总体的标准差，称为标是样本均数抽样总体的标准差，称为标准误差准误差, ,简称标准误（简称标准误（standard errorstandard

9、error），），记为记为SESE，它表示均数抽样误差的大小。，它表示均数抽样误差的大小。标准误与标准差的关系标准误与标准差的关系1.1.标准误与原总体的标准差标准误与原总体的标准差成正比成正比; ;2.2.标准误与样本含量标准误与样本含量n n的平方根成反比的平方根成反比; ;3.3.标准误计算方法为：标准误计算方法为：标准误与标准差的关系标准误与标准差的关系标准误大，说明各样本均数间差异程度大，标准误大，说明各样本均数间差异程度大，样本均数的精确性低。反之，标准误小，样本均数的精确性低。反之，标准误小，说明间的差异程度小。说明间的差异程度小。从某特定总体抽样，由于从某特定总体抽样，由

10、于是一个固定是一个固定常数，所以只有增大样本含量才能降低常数，所以只有增大样本含量才能降低样本平均数的抽样误差。样本平均数的抽样误差。在实际工作中，总体标准差在实际工作中，总体标准差往往是未往往是未知的，因而无法求得。此时，可用样本知的，因而无法求得。此时，可用样本标准差标准差S S估计估计，即以，即以估计估计，一般，一般记记为为，称作样本标准误或均数标准，称作样本标准误或均数标准误。样本标准误是平均数抽样误差的估误。样本标准误是平均数抽样误差的估计值。计值。若样本中各观测值为若样本中各观测值为x x1 1,x,x2 2,x,x3 3,x,xn n，则，则例5-1：对某地36名成年男

11、子进行红细胞数的抽样调查，s=0.171,求其标准误。例5-2：今随机抽取某厂生产的10个产品,测得其重量得数据如下（单位：克）：1050，1100，1080，1120，1200，1250，1040，1130，1300，1200求其标准误是多少？ CHISSCHISS软件实现软件实现进入统计模块进入统计模块点击点击统计统计统计描述统计描述正态定量描述正态定量描述反应变量：反应变量：标准误标准误确认确认标准差与标准误的区别样本标准差S是反映样本中各观测值变异程度大小的一个指标，它的大小说明了对该样本代表性的强弱。样本标准误是样本均数的标准差，它是抽样误差的估计值，其大小说明了样本间变异程

12、度的大小,它的大小说明了抽样误差的大小。五、五、均数的参数估均数的参数估计参数估计就是用样本统计量来估计总体参数. 主要介绍总体均数的参数估计。参数估计有点估计和区间估计。(一)点估计将样本统计量直接作为总体相应参数的估计值叫点估计（Point estimation）。如常用样本均数估计总体参数均数。例5-2：今随机抽取某药厂生产的10个产品,测得其重量得数据如下（单位：克）：1050，1100，1080，1120，1200，1250，1040，1130，1300，1200问该产品的平均重量是多少？ CHISSCHISS软件实现软件实现进入统计模块进入统计模块点击点击统计统计统计描述统计

13、描述正态定量描述正态定量描述反应变量：反应变量：确认确认(二)区间估计点估计是给出总体参数一个具体估计值，但样本估计值不一定等于总体参数。即便估计值正好等于总体参数，因为我们并不知道总体参数的真值为多少，很难验证这种相等。如随机抽取2000例健康人测量其血压，计算得到样本平均收缩压100mmHg, 但健康人总体平均收缩压不一定为100mmHg。可能是99，也可能是101，无法确定。第二节人们在得到点估计值的同时，自然希望知道样本统计量值与所估计的总体参数值到底相差多少？对估计的总体参数取值估计出一个范围，并希望知道所估计的总体参数落入这个范围的可靠程度。即： P P（ 1 1 2

14、 2）=1-=1- (1, 2)给出一个范围，使这个范围能够按足够大的概率（1- ）包含被估计参数。均数的可信区间及计算这个范围(1, 2) 称作参数的可信区间或置信区间（confidence interval，CI）， 2、1 是置信区间上、下限。（ 1- ）称为置信度或置信水平（confidence level），是估计不准的概率。通常取 = 0.05。置信区间的估计常用正态法。均数抽样正态分布下尾端概率正态分布下去掉双侧尾端概率为%的范围为多少? 正态分布置信区间（1- ）%CI估计法*在均数的抽样分布中，随机变量落在区间：的概率为1- 。为标准正态分

15、布的临界值。正态分布置信区间计算m的(1- )%置信区间是: ( - u , + u )例如，=0.05时， u=1.96，当均数和标准误已知时可以计算95%CI。例从某个大学6000名学生中随机抽取100名，测得其身高值，计算得其平均身高为170cm，标准差为5cm。试估计该校大学生平均身高为多少，其95%CI 可信区间为多少？解：该校大学生平均身高估计值为170cm，其95%CI为（170-1.96*5/10， 170+1.96*5/10） =（170-0.98，170+0.98） =（169.02，170.98）置信区间的含义 95%置信区间的意思是在相同的条件下,从同一总体中进行

16、100次随机抽样,抽得的100样本计算出100个置信区间,有95%个置信区间包括总体的均数。亦说明用这样的范围估计总体均数，平均说来每100次有95次是正确的。5%是小概率，因此，在实际应用中,就认为总体均数在算得的区间内，这种估计方法会冒5%犯错误的风险。置信区间的两要素1.准确度是置信区间包含总体均数的概率大小,其置信度是1- 。2.精度是置信区间的长度,是对总体均数的估计范围。置信区间的长度越小,精度越高。在样本例数一定的情况下,准确度越高,精度越低;准确度越低,精度越高; 在准确度一定的情况下,增大样本含量,可以提高精度。CHISSCHISS软件实现软件实现* *1.进入数据

17、模块点击数据文件建立数据库表注: 三行数分别为例数,均数,标准差2.进入统计模块进行统计计算点击统计统计推断可信区间均数的可信区间反应变量：确认均数的可信区间数据库要求1每组各一列;2 三行数据:第一行例数, 第二行均数, 第三行标准差.置信区间与参考值范围的区别参考值范围(容许区间)置信区间概念总体中个体值总体均数意义总体中绝大多数个体可能出现的范围按概率(1)估计总体参数所在范围公式1.96SD(大样本时)1.96SE (大样本时) 某厂出产一新型药丸机器，如何评价新制药丸机器是否工作正常？研发一新降糖药，如何评价其疗效？医学问题六、假设检验六、假设检验一种方法是研究整个总

18、体，即由总体中的所有个体数据计算出总体参数进行比较。这种研究整个总体的方法是很准确的，但常常是不可能进行的，因为总体往往是无限总体，或者是包含个体很多的有限总体。另一种方法研究样本，通过样本研究其所代表的总体。( (一一) )假假设检验的基本思想的基本思想抽样研究的目的是用样本提供的部分信息来推断总体特征。但是由于样本均数包含有抽样误差，用包含有抽样误差的样本均数来推断总体均数，其结论并不是绝对正确的。因而要对样本均数进行统计假设检验。假设检验又叫显著性检验（test of significance），是统计学中一个很重要的内容。假设检验的方法很多，常用的有u检验，t检验、F检验和2检验

19、等。u检验的思想例：某药厂长期生产一种丸药，规定标准为每丸重9克。标准差为0.5克，服从正态分布。现在购置使用一台新的制丸机。问题: 质检部门如何评价其工作正常?如何设计试验?如何进行试验?如何分析试验结果?螺丝帽与螺丝母问题钢笔质量问题试验设计及试验实施试验方法：现让机器生产一大批丸药,随机抽取100颗丸药,测其重量数据为：8.9, 9, 9.1，9， 8 ,9.1, 9。如何进行分析？数据结果分析对100例丸药进行统计，计算得到丸药重的平均数为9.1克。与标准重9克相差0.1克。问制丸机工作是否符合要求(正常)？与标准重9克相差0.1克的原因：1）制丸机的质量不符合要求。2）抽样误差。问

20、题的解决方法采用反正法，假设制丸机的质量符合要求，相差0.1克都是由于抽样误差造成的。分析其可能性有多大。如果不可能，或者可以性非常小，则否定原假设。反证法的思想回顾反证法是首先假设某命题不成立，然后反证法是首先假设某命题不成立，然后推理出明显矛盾的结果，从而下结论说推理出明显矛盾的结果，从而下结论说原假设不成立，原命题得证。原假设不成立，原命题得证。反证法在数学中经常运用。当论题从正反证法在数学中经常运用。当论题从正面不容易或不能得到证明时，就需要运面不容易或不能得到证明时，就需要运用反证法，此即所谓用反证法，此即所谓正难则反正难则反。反证法应用案例证明命题：素数有无穷多个。质数又称素数

21、。指在一个大于1的自然数中，除了1和此整数自身外，不能被其他自然数整除的数。素数在数论中有着很重要的地位。比1大但不是素数的数称为合数。这个古老的命题最初是由古希腊数学家欧几里德(约公元前330275)在他的著作几何原本里给出一个反证法。证明：假设命题不真，则只有有限多个素数，设所有的素数是：a1a2ai 所有的ai(i=1,2,n)，都不是M的因子，那么有两个可能：M或者为合数，有另外的素数真因子，或者M本身就是一个素数。无论哪种情况，都将和假设矛盾。所以素数有无穷多个。反证法是数学家最精当的武器。反证法是数学家最精当的武器。-牛顿牛顿“1+1=2”哥德巴赫猜 1978年徐迟报告文学哥德

22、巴赫猜想，中国人知道了陈景润和哥德巴赫猜想。 1742年，德国数学家哥德巴赫公写信给当时的大数学家欧拉提出猜想：每个不小于6的偶数都可以表示为两个奇素数之和。自然科学的皇后是数学。数学的皇冠是数论。哥德巴赫猜想，则是皇冠上的明珠。反证法的思想欲证“若P则Q”为真命题，从相反结论出发，得出矛盾，从而原命题为真。反证法的证题可以简要的概括为：“否定得出矛盾否定”。即从否定结论开始，得出矛盾，达到新的否定，反证法的思想就是“否定之否定”。解决方案1）无效假设H0：新制丸机=9 对立假设H1：新制丸机9我们计算在无效假设H0成立下，出现目前所得试验数据以及更不利于无效假设H0成立数据的可能性

23、有多大（概率P）。如果不大可能出现（概率P很小）或者不可能出现，则认为无效假设H0不成立。2）构造统计量:已知该厂生产的药丸重量服从正态分布,x N(9,0.52)根据抽样分布的性质,知抽取100颗药丸其均数也服从正态分布， N(9, 0.52/100) 对均数分布进行标准正态u变换: u N(0,1)，计算u统计量: u越大越不利于H0假设的成立。尾端概率标准正态分布下|u|出现 2及大于2的可能性多大?怎样进行决策? 小概率思想所谓小概率思想是指小概率事件（如P1.96, P0.05根据小概率事件作出结论:拒绝H0假设。即制药丸机工作不正常。 (三)小概率反证法思想先提出检验假设(无效

24、假设H0)，再用适当的统计方法给出判断假设不成立时所冒的风险大小。如果此风险足够小（P0.05），则还不能认为假设H0不成立。( (四四) ) 假假设性性检验基本步基本步骤（一）建立假设、确定显著水平；原假设（又称无效假设）H0：1= 2 备择假设H1：12 确定显著水平，一般预先设定的显著水平为0.05。（二）构造统计量和求P值；在原假设成立的前提下，选择合适的统计量，研究试验所得统计量的抽样分布，计算统计量,并求出P值。（三）统计判断与决策根据“小概率事件实际不可能性原理”下推断结论：当P时，不拒绝无效假设H0，因而也就不能接受备择假设H1。差别无统计学意义。 CHISS 软

25、件实现（第一种）第一种）*使用原始数据使用原始数据CHISS软件实现的步骤如下软件实现的步骤如下:1.进入数据模块点击数据文件打开数据库表找到文件名为b5-7.dbf数据库确认2.进入统计模块进行统计计算点击统计统计推断t检验用原始数据t检验反应变量：丸重确认单组比较时的总体均数（9.0）OK（确认） 3.进入结果模块查看结果CHISS软件实现（第二种）软件实现（第二种）*使用数据的均数和标准差步骤如下使用数据的均数和标准差步骤如下1.进入数据模块点击数据文件打开数据库表找到文件名为b5-8.dbf数据库确认2.进入统计模块进行统计计算点击统计统计推断t检验用均数t检

26、验反应变量：总体均数、样本均数确认 3.进入结果模块查看结果点击结果假假设检验的两种的两种类型型错误由于显著性检验是根据“小概率事件实际不可能性原理”来决定是否拒绝无效假设的，所以不论是拒绝还是不拒绝无效假设，都没有100%的把握。因此，在假设检验时可能犯两类错误。第第一一类类错错误误（或或型型错错误误）：是原假设为真而被拒绝，又称弃真。型错误，就是把非真实差异错判为真实差异。犯型错误的概率用表示,亦称为假阳性率。第第二二类类错错误误（或或型型错错误误）：是原假设不真但被”接受”，又称存伪。型错误，就是把真实差异错判为非真实差异,犯型错误的概率用表示 ,亦称为假阴性率。两类错误的关系客观实际否定H0“接受” H0H0成立（为真）型错误（）推断正确（1- ）H0不成立（为假）推断正确（1- ）型错误（）的大小较难确切估计1- 称为检验功效（power of test），也叫把握度。其意义是当两总体确有差别（即H1成立）时，按水平能发现它们有差别的能力。值越小，值越大；值越大，值越小。练习题医学统计与CHISS应用： P54 例5-1-至例5-7.名人格言如果你想得到一个明智的回答，如果你想得到一个明智的回答，你就必须理智的提问。你就必须理智的提问。 - 歌德歌德德国德国（1749-1832）

展开阅读全文

医学6参数估计与假设检验

最新文档