医学统计课件人卫6版 第六章.参数估计与假设检验

上传人:tia****nde 文档编号:70831470 上传时间:2019-01-18 格式:PPT 页数:28 大小:753.63KB
返回 下载 相关 举报
医学统计课件人卫6版 第六章.参数估计与假设检验_第1页
第1页 / 共28页
医学统计课件人卫6版 第六章.参数估计与假设检验_第2页
第2页 / 共28页
医学统计课件人卫6版 第六章.参数估计与假设检验_第3页
第3页 / 共28页
医学统计课件人卫6版 第六章.参数估计与假设检验_第4页
第4页 / 共28页
医学统计课件人卫6版 第六章.参数估计与假设检验_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《医学统计课件人卫6版 第六章.参数估计与假设检验》由会员分享,可在线阅读,更多相关《医学统计课件人卫6版 第六章.参数估计与假设检验(28页珍藏版)》请在金锄头文库上搜索。

1、2019/1/18,西安医学院公共卫生系,第六章 参数估计与假设检验,2019/1/18,西安医学院公共卫生系,参数估计,在实际工作中,由于总体中各观察对象之间存在着个体变异,且随机抽取的样本又只是总体中的一部分,因此计算的样本统计量,不一定恰好等于相应的总体参数。 这种由于个体变异的存在,在抽样研究中产生的样本统计量与相应的总体参数间的差异,称为抽样误差(sampling error),2019/1/18,西安医学院公共卫生系,中心极限定理 : 设从均值为、方差为2的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布。,2019/1/1

2、8,西安医学院公共卫生系,理论上可以证明: (1)从正态总体N( ,2 )中,随机抽取例数为n的样本,样本均数也服从正态分布;即使从偏态总体抽样,当n足够大时,样本均数也近似正态分布。 (2)从均数为,标准差为的正态或偏态总体,抽取例数为n的样本,样本均数的总体均数也为,标准差为 。,2019/1/18,西安医学院公共卫生系,均数的抽样误差指由抽样造成的样本均数 与总体均数之间的差异。 称标准误,它说明均数抽样误差的大小。 n越大,标准误越小,样本均数的抽样误差亦越小 实际工作中,常未知,而是用样本标准差s来估计,则有 常用来说明均数的抽样误差的大小。,2019/1/18,西安医学院公共卫生系

3、,率的抽样误差:样本率与样本率之间;样本率与总体率之间均存在差异,即抽样误差。 根据二项分布的原理,样本频率的总体概率为,率的标准误为 p= 实际工作中,总体率往往未知,常用样本率来近似代替总体率,则有 Sp = 反映率的抽样误差的大小。,2019/1/18,西安医学院公共卫生系,可信区间的概念,参数估计即用样本指标(称为统计量) 来估计总体指标(称为参数) 参数估计有两种方法: 1.点估计:未考虑抽样误差 2.区间估计:可信区间又称置信区间 (confidence interval,CI) 指按一定的概率估计总体参数的可能范围。 概率1-称为可信度,常取95%或99%,2019/1/18,西

4、安医学院公共卫生系,总体均数的95%可信区间表示: 该区间包含总体均数的概率为95% 总体均数可信区间的计算* : 已知或未知但n较大时按正态分布原理计算, 未知但n较小时按t分布的原理计算。,2019/1/18,西安医学院公共卫生系,1.已知时,由Z分布可知,正态曲线下有95%的Z值在1.96之间,即: P(-1.96Z+1.96)=0.95 P(-1.96 +1.96)=0.95 移项后整理得,总体均数的95%可信区间为,2019/1/18,西安医学院公共卫生系,2.未知,但n足够大(如n100)时,可知t分布 逼近Z分布,此时t曲线下有95%的t值在1.96之间 即:P(-1.96t+1

5、.96)=0.95 P(-1.96 +1.96)=0.95 P( )=0.95 故总体均数的95%可信区间为,2019/1/18,西安医学院公共卫生系,前面讲过,对正态变量x采用 变换,则将正态分布N(,2)变换为标准正态分布N(0,1)。 已知样本均数也服从正态分布,那么对样本均数采用Z变换,即可将其变换为标准正态分布,即Z分布。,t分布,2019/1/18,西安医学院公共卫生系,但实际工作中 需用 来估计,这样,对正态变量采用的就不是Z变换而是t变换了,即t =( -)/ 其结果即为t分布。 见t分布曲线图,2019/1/18,西安医学院公共卫生系,图5.1 自由度为1、5、的t分布,20

6、19/1/18,西安医学院公共卫生系,t分布的特征:(与标准正态分布相比?) 以0为中心,左右对称的单峰分布; t分布是一簇曲线,形态变化与n(即自由度)大小有关。自由度越小,t分布曲线越低平;自由度越大,t分布曲线越接近标准正态分布曲线。 t分布峰部较矮,尾部翘得较高,说明远侧的t值的个数相对较多,即尾部面积(概率P)较大。自由度越小这种情况越明显,渐大时,t分布渐逼近标准正态分布;当=时,t分布就成为标准正态分布了。 附表2,t界值表,2019/1/18,西安医学院公共卫生系,3.未知且n小时,某自由度的t曲线下有95%的t值在 之间,即:,故总体均数的95%可信区间为,2019/1/18

7、,西安医学院公共卫生系,例5.1 对某人群随机抽取20人,用某批号的结核菌素作皮试,平均浸润直径为10.9cm,标准差为3.86cm。问这批结核菌素在该人群中使用时,皮试的平均浸润直径的95%可信区间是多少?,2019/1/18,西安医学院公共卫生系,总体均数的单侧(1-)置信区间为:,总体均数的95%可信区间的含义: 该区间包含总体均数的概率为95%,2019/1/18,西安医学院公共卫生系,总体率可信区间的计算 1.查表法:n50,特别是p接近0或100%时,可查附表6百分率的置信区间表。 2.正态近似法*:当n较大且np和n(1-p)均大于5时,二项分布接近正态分布,则总体率的双侧(1-

8、)可信区间为: P /2Sp,2019/1/18,西安医学院公共卫生系,抽样误差及其大小 t分布的特征 总体均数可信区间的计算 总体率可信区间的计算 可信区间的涵义,小结,2019/1/18,西安医学院公共卫生系,假设检验,亦称显著性检验: 是统计推断的另一个重要内容。 其目的是比较总体参数之间有无差别。,2019/1/18,西安医学院公共卫生系,2019/1/18,例:医生在某山区随机测量了30名健康成 年男子的脉搏,平均次数为74.2次分钟, 标准差为6.5次分,但是根据医学常识, 一般男子的平均脉搏次数为72次分,问 该山区男子脉搏数与一般男子是否不同?,造成两者数值不同的原因可能有两个

9、: 1)抽样误差所致; 2)由于环境条件的影响,两均数之间有本质差异。,2019/1/18,西安医学院公共卫生系,2019/1/18,西安医学院公共卫生系,先假定该山区所有男子脉搏数数值组成一个总体, 其总体均数和标准差均为未知数,分别以 、 表示。 若假设该山区男子的脉搏数与一般地区的男子相 同,即属于同一总体, 72,所测量的30名男子的 平均脉搏数(样本均数)之所以不恰好等于72次分, 是由于抽样误差所致。,2019/1/18,西安医学院公共卫生系,2019/1/18,西安医学院公共卫生系,如果上述假设成立,则理论上讲, 样本均数应在总体均数( 72)的附近, 远离总体均数的可能性很小。

10、 如果将样本均数变换为t值,则t值应在 0附近,远离0的可能性很小。 如果t值远离0,可认为上述假设不成立,拒绝 上述假设。则认为两均数之间存在本质差异。,2019/1/18,西安医学院公共卫生系,2019/1/18,西安医学院公共卫生系,假设检验的一般步骤,建立假设和确定检验水准 选定检验方法和计算检验统计量 确定P值和做出统计推断结论,返回,2019/1/18,西安医学院公共卫生系,2019/1/18,西安医学院公共卫生系,假设: H0(检验假设或无效假设)1=2 H1(备择假设)12或12 (H0是根据推断目的,从反证法的思想提出的 H1是与H0相联系的对立的假设),建立假设,2019/

11、1/18,西安医学院公共卫生系,2019/1/18,西安医学院公共卫生系,检验水准又称显著性水准, 用表示 是预先规定的概率值,一般取0.05,但也并非一成不变,要根据不同的研究目的而定。 一般,可提高可靠性;,有利于发现研究总体可能存在的差异,但可靠性降低。,确定检验水准,假设检验包括单侧检验和双侧检验两种情况 当根据专业知识已知两总体的参数中甲肯定不会小于乙,或甲肯定不会大于乙时,可考虑用单侧检验,否则,宜用双侧检验。,返回,2019/1/18,西安医学院公共卫生系,2019/1/18,西安医学院公共卫生系,由计算的统计量(t值或u值等)查相应的界值表,求P值。将P与比较: 当P时,按所取拒绝H0,接受H1; 当P时,接受H0,拒绝H1。 P的含义:可以看做是H0成立的概率。,2019/1/18,西安医学院公共卫生系,2019/1/18,西安医学院公共卫生系,*注意:假设检验的结论是具有概率性的,不论是拒绝H0或不拒绝H0,都有可能发生错误,即第一类错误或二类错误。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号