北邮考研概率论与数理统计7.4区间估计(3).

上传人:我** 文档编号:117491269 上传时间:2019-12-05 格式:PPT 页数:23 大小:1.48MB
返回 下载 相关 举报
北邮考研概率论与数理统计7.4区间估计(3)._第1页
第1页 / 共23页
北邮考研概率论与数理统计7.4区间估计(3)._第2页
第2页 / 共23页
北邮考研概率论与数理统计7.4区间估计(3)._第3页
第3页 / 共23页
北邮考研概率论与数理统计7.4区间估计(3)._第4页
第4页 / 共23页
北邮考研概率论与数理统计7.4区间估计(3)._第5页
第5页 / 共23页
点击查看更多>>
资源描述

《北邮考研概率论与数理统计7.4区间估计(3).》由会员分享,可在线阅读,更多相关《北邮考研概率论与数理统计7.4区间估计(3).(23页珍藏版)》请在金锄头文库上搜索。

1、第第1 1页页 1 引言 前面,我们讨论了参数点估计. 它 是用样本算得的一个值去估计未知参数. 但是,点估计值仅仅是未知参数的一个 近似值,它没有反映出这个近似值的误 差范围,使用起来把握不大. 区间估计 正好弥补了点估计的这个缺陷 . 7.4 区间估计 第第2 2页页 2 譬如,估计湖中鱼数的问题中,若我们根 据一个实际样本,得到鱼数N的极大似然估计为 1000条. 若我们能给出一个区间,在此区间内我们 合理地相信 N 的真值位于其中. 这样对鱼数的 估计就有把握多了. 实际上,N的真值不一定恰恰就是1000 条,可能大于也可能小于1000条. 第第3 3页页 3 也就是说,我们希望确定一

2、个区间,使我们能 以比较高的可靠程度相信它包含真参数值. 湖中鱼数的真值 这里所说的“可靠程度”是用概率来度量的,称为置 信概率,置信度或置信水平. 习惯上把置信水平记作 ,这里 是一个 很小的正数. 第第4 4页页 4 置信水平的大小是根据实际需要选定的. 例如,通常可取置信水平 =0.95或0.9等. 根据一个实际样本,由给定的置信水平,我 小的区间 ,使们求出一个尽可能 置信区间. 称区间 为 的置信水平为 的 第第5 5页页 1、 区间估计的概念 定义1 设 是总体的一个参数,其参数空间为, x1, x2 , , xn是来自该总体的样本,对给定的一个 (0 1),若有两个统计量 和 ,

3、若对任意的 ,有 (1) 则称随机区间( )为 的置信水平 为1- 的置信区间,或简称( )是 的1-置信区间. 和 分别称为 的(双侧)置信下限 和置信上限. 第第6 6页页 定义 沿用定义1的记号,如对给定的 (0 1) ,对任意的,有 称 为 的1- 同等置信区间。 同等置信区间是把给定的置信水平1- 用足 了。常在总体为连续分布场合下可以实现 。 第第7 7页页 7 求参数 的置信度为 的置信区间. 例1 设X1,Xn是取自 的样本, N(0, 1) 2、置信区间的求法 明确问题,是求什么参数的 置信区间?置信水平是多少? 寻找未知参数的 一个良好估计. 选 的点估计为 解: 寻找一个

4、待估参数和 估计量的函数 ,要求 其分布为已知. 有了分布,就可以求出 Z取值于任意区间的概率. 第第8 8页页 对给定的置信水平查正态分布表得 对于给定的置信水平(大概率), 根据Z的分布, 确定一个区间, 使得Z取值于该区间的概率为置信水平. 使为什么 这样取? 从中解得 于是所求 的 置信区间为 也可简记为 第第9 9页页 9 从例1解题的过程,我们归纳出求置 信区间的一般步骤如下: 1. 明确问题, 是求什么参数的置信区间? 置信水平 是多少? 2. 寻找参数 的一个良好的点估计 T (X1,X2,Xn) 称S(T, )为枢轴量. 3. 寻找一个待估参数 和估计量T的函数 S(T, )

5、,且其分布为已知. 第第1010页页 10 4. 对于给定的置信水平 ,根据S(T, ) 的分布,确定常数a, b,使得 P(a S(T, )b)= 5. 对“aS(T, )b”作等价变形,得到如下 形式: 则 就是 的100( )的置信区间. 可见,确定区间估计很关键的是要寻找 一个待估参数 和估计量T 的函数S(T, ), 且S(T, )的分布为已知, 不依赖于任何未知 参数 (这样我们才能确定一个大概率区间). 第第1111页页 11 这里,我们主要讨论总体分布为正态的情形. 若样本容量很大,即使总体分布未知,应用中心极限 定理,可得总体的近似分布为正态分布,于是也可以 近似求得参数的区

6、间估计. 教材上(7.5节)讨论了以下几种情形: 单个正态总体均值 和方差 的区间估计. 两个正态总体均值差 和方差比 的区间估计. 第第1212页页 关于置信区间的构造有两点说明: 满足置信度要求的a与b通常不唯一。若有可能, 应选平均长度 达到最短的a与b,这在枢 轴量S=S(T,)的分布为对称分布场合通常容易实 现。 实际中,选平均长度 尽可能短的a与b, 这往往很难实现,因此,常这样选择 a与b,使得 两个尾部概率各为 /2,即P(Sb)= /2, 这样的置信区间称为等尾置信区间。这是在S的分 布为偏态分布场合常采用的方法。 第第1313页页 例1(续)设x1, x2 , , x10是

7、来自N(, 2)的样本, 2未知,则 的置信水平为1- 的置信区间为 其中, ,s 分别为样本均值和样本标准差。 这里用它来说明置信区间的含义。 若取 =0.10,则t0.05(9)=1.8331,上式化为 第第1414页页 现假定 =15, 2 =4,则我们可以用随机模拟方法 由N(15,4)产生一个容量为10的样本,如下即是这 样一个样本: 14.85 13.01 13.50 14.93 16.97 13.80 17.9533 13.37 16.29 12.38 由该样本可以算得 从而得到 的一个区间估计为 该区间包含 的真值-15。现重复这样的方法 100次,可以得到100个样本,也就得

8、到100个 区 间,我们将这100个区间画在图1上。 第第1515页页 由图1可以 看出,这 100个区间 中有91个 包含参数 真值15, 另外9个不 包含参数 真值。 图1 的置信水平为0.90的置信区间 可见:置信水平1- 的含义是指在大量使用该 置信区间时,至少有100(1-)%的区间含有 。 第第1616页页 取=0.50, 我们也可以 给出100个这 样的区间, 见图2。可以 看出,这100 个区间中有 50个包含参 数真值15, 另外50个不 包含参数真 值。 图2 的置信水平为0.50的置信区间 第第1717页页 17 2. 估计的精度要尽可能的高. 如要求区间 长度 尽可能短

9、,或能体现该要求的其 它准则. 1. 要求 以很大的可能被包含在区间 内,就是说,概率 要尽可能大. 即要求估计尽量可靠. 可靠度与精度是一对矛盾,一般是在 保证可靠度的条件下尽可能提高精度. 可靠度与精度:注:置信区间 第第1818页页 附 录 1、置信区间是唯一的吗? 置信区间的可靠性和精度。 2、均匀分布的区间估计。 第第1919页页 19 1、需要指出的是,给定样本,给 定置信水平,置信区间也不是唯一的. 对同一个参数,我们可以构造许多置信区间. 注意 例如,设X1,Xn是取自 的样本 , 求参数 的置信水平为 的 置信区间. N(0, 1) 取枢轴量 第第2020页页 20 由标准正

10、态分布表,对任意a、b,我们可 以求得P( aUb)=0.95即可 . 例如,由 P(-1.96U1.96)=0.95 我们得到 均值 的置信水平为 的 置信区间为 第第2121页页 21 由 P(-1.75U2.33)=0.95 这个区间比前面一个要长一些. 置信区间为 我们得到 均值 的置信水平为 的 第第2222页页 22 我们总是希望置信区间尽可能短. 类似地,我们可得到若干个不同的置信区间. 任意两个数a和b,只要它们的纵标包含 f(u)下95%的面积,就确定一个95%的置信 区间. 第第2323页页 23 在概率密度为单峰且对称的情形,当a =-b时 求得的置信区间的长度为最短.

11、a =-b 第第2424页页 24 在密度函数不对称时, 习惯上仍取对称的分位点来确定置信区间(如图). 注意 第第2525页页 25 也就是说,要想得到的区间估计可 靠度高,区间长度就长,估计的精度就 差.这是一对矛盾. 实用中应在保证足够可靠的前提下 ,尽量使得区间的长度短一些 . 我们可以得到未知参数的的任何置信 水平小于1的置信区间,并且置信水平越 高,相应的置信区间平均长度越长. 第第2626页页 2、例 设x1, x2 , , xn是来自均匀总体U(0, )的 一个样本,试对给定的 (0 1)给出 的1 - 同等置信区间。 解:(1)取x (n) 作为枢轴量,其密度函数为 p(y; )= nyn , 0y 1; (2)x (n) / 的分布函数为F(y)=yn, 0y 1,故 P(cx (n) / d)= d n-cn, 因此我们可以适当地选择c和d满足d n-cn=1- 第第2727页页 (3)利用不等式变形可容易地给出 的1- 同等置信区间为x (n) /d,x (n) /c,该区间 的平均长度为 。不难看出, 在0cd1及dn-cn=1- 的条件下,当 d=1, c= 时, 取得最小值,这 说明 是 的置信水平1- 为 最短置信区间。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号