第五章 参数估计课件

上传人:我*** 文档编号:138997091 上传时间:2020-07-19 格式:PPT 页数:66 大小:952KB
返回 下载 相关 举报
第五章 参数估计课件_第1页
第1页 / 共66页
第五章 参数估计课件_第2页
第2页 / 共66页
第五章 参数估计课件_第3页
第3页 / 共66页
第五章 参数估计课件_第4页
第4页 / 共66页
第五章 参数估计课件_第5页
第5页 / 共66页
点击查看更多>>
资源描述

《第五章 参数估计课件》由会员分享,可在线阅读,更多相关《第五章 参数估计课件(66页珍藏版)》请在金锄头文库上搜索。

1、2015/10/12,1,2011级预防医学专业医学统计学,沈月平 副教授,PhD 医学部公共卫生学院 流行病与卫生统计教研室 E-mail:shenyuepingsuda.edu.cm Office: 401-1403,2,第五章 参数估计,前言 第一节 抽样误差 第二节 t-分布和二项分布 第三节 单个总体参数的置信区间 第四节 两总体之差的置信区间 小结 作业,计量资料的统计分析,统计描述,统计推断,集中趋势,离散趋势,参数估计,假设检验,点估计,区间估计,两样本均数比较t,u-test,多个样本均数比较F-test,计数资料的统计分析,统计描述,统计推断,集中趋势,离散趋势,参数估计,

2、假设检验,绝对数,相对数,率的标准误,点估计,区间估计,两样本率比较2-test,多个样本率比较2-test,5,第一节 抽样误差,抽样误差(sampling error) :由抽样造成的统计量与总体参数及样本统计量之间的差别称为抽样误差。 均数抽样误差和率的抽样误差 是建立在抽样研究基础上所发生的偏差,只能减小,不可避免,6,一、均数的抽样误差,由于随机抽样所引起的样本均数与总体均数之间的差异或样本均数之间的差异; 如何评估抽样误差?,7,如何评估抽样误差?,抽样试验(sampling trial),抽样试验,某市2008年19岁女生身高服从均数=160.5cm,=5.2cm的正态分布; 从

3、XN(160.5,5.22)的正态总体中随机抽样,样本含量nj=20,g=100;共抽100次;,图1. 2008年某市19岁女生身高均数 N(160.5,5.22)的抽样示意,=160.5cm =5.2cm X1,X2,X3Xj ,160.19, 1.05 158.97, 1.39 160.37, 1.47 : 161.64, 1.44,100个,10,新的分布特点,样本均数组成一个新的分布特点,各样本均数未必等于总体均数; 各样本均数间存在差异; 样本均数的分布很有规律; 100个样本均数的均数为160.43cm,而原总体均数为160.5cm ( ) 样本均数的变异范围较原变量的变异范围大

4、大缩小;标准差为1.18(5.2);,中心极限定理,若原变量 服从正态分布,则新变量服从正态分布; 若 原变量不服从正态分布,n较大(大于等于30或50),则新变量服从正态分布; n较小,新变量为非正态分布;,标准误:估计抽样误差大小的指标,标准误(standard error,SE):样本统计量的标准差; 样本均数的标准误(standard error of mean,SEM): ; 样本均数的标准误的估计值:,例 2000年某研究者随机调查某地健康成年男子27人,得到血红蛋白含量的均数为125g/L,标准差为15g/L。试估计该样本均数的抽样误差。,均数标准误的含义,反映均数抽样误差大小的

5、一个指标; 均数的标准误 与原分布的标准差成 正比,与抽样样本量n开根号成反比; 欲减少抽样误差,可增加样本量; 利用均数标准误可以进行总体均数的置信区间的估计和假设检验。,第二节 t分布,t分布的由来 t分布的图形和特征 t界值表,标准正态变换,X,0, 1,u,t变换,0,t,抽样实验,t分布的由来,X,t分布图形的演变,t分布图形的演变,英国统计学家Gosset于1908年以笔名“Student”发表了一篇论文,提出了t分布( distribution)的理论,因此t分布又称为学生氏t分布,其分布密度函数是:,其中, 为伽玛函数符号,它是已知函数;为圆周率;表示自由度。,24,t分布图形

6、的特征,单峰分布,以0为中心,左右对称 只有一个参数 (自由度n-1), 越小,则t值越分散,峰部越 矮而尾部 翘得越高 当逼近时, t分布逼 近u分布,t分布图形下面积具有规律性,总面积为1; 任意两区间的面积都可以用积分的方法求出; 当单双侧确定时,自由度确定时,尾部面积 ()与横轴t值之间有一一对应的关系; t/2,表示双侧尾部面积为,自由度为时的t界值; t, 表示单侧尾部面积为,自由度为时的t界值;,t界值表的特点(p410),表示在单双侧确定时,自由度确定时,t界值越大,外围面积(P)越小;反之亦然; 单双侧确定时,外围面积(或P)确定时,自由度越大, t界值越小,当 时,t=u;

7、 t0.05/2,=1.96; t0.01/2,=2.58,第三节 单个总体参数的置信区间,(二)区间估计(interval estimation),按预先给定的概率(1)确定的包含未知总体参数的可能范围。,(一)点估计:用样本统计量直接作为总体参数的估计值,1、已知,单侧:,双侧:,或,一、总体均数的置信区间 (一)正态分布法,2、未知,但样本例数n足够大时(50),双侧:,单侧:,或,(一)正态分布法,3、未知时,n不是很大(最常用),双侧:,单侧:,或,(二)t分布法,32,例5.3,33,置信区间的含义,表示以一定的置信区间(1-)估计总体均数(参数)可能的波动范围; 总体均数95%C

8、I(confidence interval)表示随机抽样100次(n固定),计算100个置信区间,平均有95个区间包含总体均数,有5个不包含;但对一次抽样来讲,只能说是包含或不包含 95%CI与99%CI的区别 点估计与置信区间的差别 正常参考值范围与置信区间的差别,二、 二项分布 (Binomial distribution)与率的置信区间,Bernoulli试验,以A表示所感兴趣的事件,A事件发生称为“成功”,不出现称为“失败”。相应的这类试验称作为“成一败型”试验或Bernoulli试验。,Bernoulli试验,满足条件 (1)每次试验结果只能是两个互斥结果之一(A或非A)。 (2)每

9、次试验的条件不变,每次试验结果A事件发生的概率为常数。 (3)各次试验独立,即每次试验出现事件A的概率与前面各次试验出现的结果无关。,二项分布的概念,n次重复独立试验(Bernoulli试验),当每次试验的“阳性概率”保持不变时,出现“阳性”的次数k=0,1,2,n的一种概率分布。 ,k=0,1,2, n n为试验例数,k为阳性次数, 为阳性率,,当n和不同时,二项分布的概率是不同的,所 以说n和是二项分布的两个重要参数。 如果随机变量x服从以n和为参数的二项分布, 则记作xB(n,)。,二项分布的概率计算,恰好有k例阳性数的概率为 最多发生k例,即xk的累计概率 为 最少发生k例,即xk的累

10、计概率 二项分布概率的递推公式为,二项分布的性质,2、二项分布的正态近似 (normal approximation),概率论中的中心极限定理证明:当n足够大时,且不接近于0也不接近于1时,且 n 和n(1 )5,二项分布xB(n,)近似于正态分布 N(n, )。,样本率的分布和正态近似,样本率的分布和正态近似,例5X 从阳性率样本率=0.6的总体中随机抽取样本量为16的样本,求样本率p的均数和标准差。 样本均数的标准差称为均数的标准误。同样样本率的标准差也称为率的标准误,它描述了样本率抽样误差的大小。,样本率的分布和正态近似,样本率分布的正态近似 当样本量n较大,总体率不接近于0也不接近1时

11、,且n 和n(1 )5, 样本阳性率也近似服从正态分布pN(, )。 事实上,总体率,一般是不知道的,往往用p来估计,用样本率的标准误的估计值 来估计 。,利用样本资料可估计二项分布总体概率的1-置信区间,一般取 0.05或0.01。对于 ,且接P近于0或1时,可直接查表得到总体概率的(1- )置信区间。 例5.5,总体率的置信区间,查表法,当n足够大,且 P和1-P均不太小,如nP和n(1-P)均大于5时,P的抽样分布逼近正态分布。此时,可根据正态分布的特性计算总体率的置信区间。,总体率的置信区间,正态近似法,率的抽样误差,即标准误,泊松分布(Poisson Distribution ):补

12、充内容,是一种典型的离散型随机变量的分布,主要用于描述事件出现概率很小而样本含量或试验次数很大的随机变量的概率分布。 当n-,P0.05时,这时二项分布向泊松分布逼近; 泊松分布用来分析医学上人群中遗传缺陷、癌症等发病率很低的非传染性疾病的发病或患病人数的分布; 也可用于研究单位时间、空间、容积内某罕见事件发生次数的分布;,Poisson分布是二项分布的特例,由于这时n特别大,p特别小,在数学上用二项分布计算n次重复独立试验(Bernoulli试验),出现“阳性”的次数X=0,1,2,n的概率变得十分困难,所以,可以通过Poisson分布近似计算出现“阳性”次数X概率值 如已知年上海市万妇女人

13、群中乳腺癌的发病人数为人(=0.0004),计算某小区万人中刚好出现人的概率?,二项分布的概率公式可推导出泊松分布的概率计算公式为: 为单位时间(空间) 稀有事件的发生数(阳性数)的总体均数. 二项分布当n很大而很小时即逼近于参数=n的泊松分布 ,记做xP(),泊松分布的性质,1、泊松分布均数等于方差:= 2 =,2. 泊松分布的可加性,泊松分布的正态近似,数理统计证明:当足够大时,泊松分布趋向于正态分布。所以只要相当大(如50)即可认为泊松分布近似于正态分布。,二项分布的泊松分布近似,例514 根据以往经验新生儿染色体异常为1%,试分别用二项分布和泊松分布原理求100名新生儿中发生x例染色体

14、异常的概率,第四节 两总体参数之差的置信区间,两总体均数差的置信区间,例5.7 为研究某种外用中药搽剂对小鼠琼脂肉芽肿的抑制作用,某医院医师选取一级昆明种雌小鼠21只,随机分为实验组10只和对照组11只,分别测得其实验前的肉芽肿重见表5.7,试估计实验前两组小鼠的肉芽肿重均数之差的95%置信区间。,两总体率差的置信区间,64,小结,抽样误差及标准误的概念 t-distribution:参数 二项分布:两个参数 n, 泊松分布:参数 置信区间:1-:单个参数,两个参数差值,65,课后作业 P83 一、名词解释 二、最佳选择题 四、计算分析题 1,2,3 第六章 预习Problems: 1、假设检验的概念? 2、举例说明假设检验的步骤? 3、讲述假设检验的基本思想? 不限书上,可查资料,66,预祝同学们 节日快乐!,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号