第四章节参数估计与假设检验课件

上传人:E**** 文档编号:91709246 上传时间:2019-07-01 格式:PPT 页数:122 大小:2.27MB
返回 下载 相关 举报
第四章节参数估计与假设检验课件_第1页
第1页 / 共122页
第四章节参数估计与假设检验课件_第2页
第2页 / 共122页
第四章节参数估计与假设检验课件_第3页
第3页 / 共122页
第四章节参数估计与假设检验课件_第4页
第4页 / 共122页
第四章节参数估计与假设检验课件_第5页
第5页 / 共122页
点击查看更多>>
资源描述

《第四章节参数估计与假设检验课件》由会员分享,可在线阅读,更多相关《第四章节参数估计与假设检验课件(122页珍藏版)》请在金锄头文库上搜索。

1、参数估计与假设检验 Parameter Estimation &Hypothesis Testing,吴涛 安徽大学数学科学院,2019/7/1,2,第五章 参数估计与假设检验,5.1 参数估计 5.2 假设检验 5.3 非参数检验,2019/7/1,3,什么是参数估计?,参数是刻画总体某方面概率特性的数量.,当此数量未知时,从总体抽出一个样本, 用某种方法对这个未知参数进行估计就 是参数估计.,例如,X N ( , 2),若, 2未知, 通过构造样本的函数, 给出 它们的估计值或取值范围就是参数估计 的内容.,2019/7/1,4,参数估计在统计方法中的地位,2019/7/1,5,参数估计的

2、类型,点估计 估计未知参数的值,区间估计 估计未知参数的取值范围, 并使此范围包含未知参数 真值的概率为给定的值.,2019/7/1,6,点估计的思想方法,设总体X 的分布函数的形式已知, 但含有一个或多个未知参数:1,2, ,k,设 X1, X2, Xn为总体的一个样本,构造 k 个统计量:,随机变量,点估计方法,2019/7/1,7,当测得样本值(x1, x2, xn)时,代入上述 方程组,即可得到 k 个数:,数 值,7-6,并建立k个方程。,2019/7/1,8,频率替换法,利用事件A 在 n 次试验中发生的频率,作为事件A 发生的概率 p 的估计量,7-7,三种常用的点估计方法,20

3、19/7/1,9,方法,用样本 k 阶矩作为总体 k 阶矩的估计量, 建立含有待估参数的方程, 从而解出待估参数,7-9,一般, 不论总体服从什么分布, 总体期望 与方差 2 存在, 则它们的矩估计量分别为,矩法,2019/7/1,10,7-10,事实上,按矩法原理,令,2019/7/1,11,7-11,设待估计的参数为,设总体的 r 阶矩存在,记为,样本 X1, X2, Xn 的 r 阶矩为,令, 含未知参数 1,2, ,k 的方程组,2019/7/1,12,7-12,解方程组 , 得 k 个统计量:,未知参数 1, ,k 的矩估计量,代入一组样本值得 k 个数:,未知参数 1, ,k 的矩

4、估计值,2019/7/1,13,极大似然估计法,思想方法:一次试验就出现的 事件有较大的概率,例如: 有两外形相同的箱子,各装100个球 一箱 99个白球 1 个红球 一箱 1 个白球 99个红球,现从两箱中任取一箱, 并从箱中任取一球, 结果所取得的球是白球.,答: 第一箱.,7-17,问: 所取的球来自哪一箱?,2019/7/1,14,一般, 设 X 为离散型随机变量, 其分布律为,则样本 X1, X2, Xn的概率分布为,7-21,或,称 L( ) 为样本的似然函数,2019/7/1,15,称这样得到的,为参数 的极大似然估计值,称统计量,为参数 的极大似然估计量,7-22,极大似然法的

5、思想,2019/7/1,16,若 X 连续, 取 f (xi, )为Xi 的密度函数,似然函数为,注1,注2,未知参数可以不止一个, 如1, k,设X 的密度(或分布)为,则定义似然函数为,2019/7/1,17,为似然方程组,若对于某组给定的样本值 x1, x2, xn, 参数 使似然函数取得最大值, 即,2019/7/1,18,显然,,称统计量,为1, 2, k 的极大似然估计量,7-25,2019/7/1,19,极大似然估计方法,1) 写出似然函数 L,7-28,2019/7/1,20,可得未知参数的极大似然估计值,然后, 再求得极大似然估计量.,7-29,L是 的可微函数,解似然方程组

6、,若,L不是 的可微函数, 需用其它 方法求极大似然估计值.,若,2019/7/1,21,引例 已知 X N ( ,1),不同样本算得的 的估计值不同,因此除了给出 的点估计外, 还希望根据所给的样本确定一个随机区间, 使其包含参数真值的概率达到指定的要求., 的无偏、有效点估计为,区间估计,2019/7/1,22,如引例中,要找一个区间,使其包含 的真值的概率为0.95. ( 设 n = 5 ),取,查表得,2019/7/1,23,这说明,即,称随机区间,为未知参数 的置信度为0.95的置信区间.,2019/7/1,24,反复抽取容量为5的样本,都可得一个区间,此区间不一定包含未知参数 的真

7、值, 而包含真值的区间占95%.,若测得 一组样本值,它可能包含也可能不包含 的真值, 反复,抽样得到的区间中有95%包含 的真值.,算得,置信区间的意义,2019/7/1,25,2019/7/1,26,取 = 0.05,2019/7/1,27,设 为待估参数, 是一给定的数,( 01). 若能找到统计量, 使,置信区间或区间估计.,置信下限,置信上限,置信区间的定义,2019/7/1,28, 反映了估计的可靠度, 越小, 越可靠.,置信区间的长度 反映了估计精度, 越小, 1- 越大, 估计的可靠度越高,但, 确定后, 置信区间 的选取方法不唯一, 常选最小的一个.,越小, 估计精度越高.,

8、这时, 往往增大, 因而估计精度降低.,几点说明,2019/7/1,29,处理“可靠性与精度关系”的原则,2019/7/1,30,寻找一个样本的函数,它含有待估参数, 不含其它未知参数, 它的分布已知, 且分布不依赖于待估参数 (常由 的点估计出发考虑 ).,例如,求置信区间的步骤, 称为枢轴量,取枢轴量,2019/7/1,31,给定置信度 1 ,定出常数 a , b ,使得,( 引例中,由,解出,得置信区间,引例中,2019/7/1,32,(一) 一个正态总体 X N ( 2)的情形,置信区间常用公式,(1) 方差 2已知, 的置信区间,2019/7/1,33,解,得 的置信度为 的置信区间

9、为,2019/7/1,34,(2) 方差 2未知 , 的置信区间,由,确定,故 的置信区间为,推导 选取枢轴量,2019/7/1,35,(3) 当 已知时, 方差 2 的 置信区间,取枢轴量 ,,得 2 的置信度为 置信区间为,由概率,2019/7/1,36,(4) 当 未知时, 方差 2 的置信区间,选取,得 2 的置信区间为,则由,2019/7/1,37,为取自总体 N ( 1 12 ) 的样本,为取自总体 N ( 2 22 ) 的样本,置信度为 1 ,分别表示两样本的均值与方差,(二) 两个正态总体的情形,2019/7/1,38,相互独立,的置信区间为,2019/7/1,39,(2) 未

10、知( 但 ) 的置信区间,2019/7/1,40,的置信区间为,2019/7/1,41,相互独立,(3) 未知, n, m 50, 的置信区间,2019/7/1,42,令 Zi = Xi -Yi , i = 1,2, n, 可以将它们看成来 自正态总体 Z N ( 1 2 , 12 + 22) 的样本,仿单个正态总体公式(2) 的置信区间为,(4) 未知, 但 n = m , 的置信区间,2019/7/1,43,取枢轴量,2019/7/1,44,取枢轴量,2019/7/1,45,2019/7/1,46,(三) 单侧置信区间,定义 对于给定的 (0 1) , 是待估参数,是总体 X 的样本,若能

11、确定一个统计量,使得,则称,为置信度为1 - 的单侧置信区间.,2019/7/1,47,若总体 X 的分布未知, 但样本容量很大, 由中心极限定理, 可近似地视,若2已知, 则 的置信度为1 - 的置信区间 可取为,若2未知, 则 的置信度为1 - 的置信区间 可取为,(四) 非正态总体均值的区间估计,2019/7/1,48,1、正态总体的参数估计,设总体服从正态分布,则其点估计和区间估计可同时由以下命令获得: muhat,sigmahat,muci,sigmaci = normfit(X,alpha),此命令在显著性水平alpha下估计数据X的参数(alpha缺省时设定为0.05),返回值m

12、uhat是X的均值的点估计值,sigmahat是标准差的点估计值, muci是均值的区间估计,sigmaci是标准差的区间估计.,参数估计的Matlab实现,2019/7/1,49,【5.1.1】例分别使用金球和铂球测定引力常数 (1)用金球测定观察值为:6.683 6.681 6.676 6.678 6.679 6.672 (2)用铂球测定观察值为:6.661 6.661 6.667 6.667 6.664 设测定值总体为N( , 2 )( 和为未知)。对(1)、(2)两种情况分别求和的置信度为0.9的置信区间。,X=6.683 6.681 6.676 6.678 6.679 6.672;

13、Y=6.661 6.661 6.667 6.667 6.664; mu,sigma,muci,sigmaci=normfit(X,0.1) %金球测定的估计 MU,SIGMA,MUCI,SIGMACI=normfit(Y,0.1) %铂球测定的估计 运行后结果显示如下: mu = 6.6782 sigma = 0.0039,2019/7/1,50,muci = 6.6750 6.6813 sigmaci = 0.0026 0.0081 MU = 6.6640 SIGMA = 0.0030 MUCI = 6.6611 6.6669 SIGMACI = 0.0019 0.0071,由 此可知, 金

14、球测定的估计值为6.6782,置信区间为6.6750,6.6813; 的估计值为0.0039,置信区间为0.0026,0.0081。 铂球测定的估计值为6.6640,置信区间为6.6611,6.6669; 的估计值为0.0030,置信区间为0.0019,0.0071。,2019/7/1,51,phat=mle(dist,X) %返回用dist指定分布的最大似然估计值, phat, pci=mle (dist,X) %置信度为95% phat, pci=mle (dist,X, alpha) %置信度由alpha确定 phat, pci=mle (dist,X, alpha,pl) %仅用于二项

15、分布,pl为试验次数。 说明 dist为分布函数名,X为数据样本,alpha为显著水平,(1- ) 100%为置信度。 X=binornd(20,0.75) %产生二项分布的随机数 X = 17 p,pci=mle(bino,X,0.05,20) %求概率的估计值和置信区间,置信度为95% p = 0.85,利用mle函数进行参数估计,pci = 0.62107 0.96793,2019/7/1,52,常用分布的参数估计函数,2019/7/1,53,【例5.1.2】 我院某年级信息专业数学分析成绩的平均值和标准差计算,我院学生的数据为excel文件:,2019/7/1,54,% 我院某年级信息专业数学分析成绩的平均值和标准差计算 C=load(e:dataAA); B=C.A; mu_cul, sigma_cul = normfit(B(:,3) Score_max=max(B(:,3) Score_min=min(B(:,3),mu_cul = 77.0

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号