概率论与数理统计7.3置信区间

上传人:宝路 文档编号:47853265 上传时间:2018-07-05 格式:PPT 页数:26 大小:1.07MB
返回 下载 相关 举报
概率论与数理统计7.3置信区间_第1页
第1页 / 共26页
概率论与数理统计7.3置信区间_第2页
第2页 / 共26页
概率论与数理统计7.3置信区间_第3页
第3页 / 共26页
概率论与数理统计7.3置信区间_第4页
第4页 / 共26页
概率论与数理统计7.3置信区间_第5页
第5页 / 共26页
点击查看更多>>
资源描述

《概率论与数理统计7.3置信区间》由会员分享,可在线阅读,更多相关《概率论与数理统计7.3置信区间(26页珍藏版)》请在金锄头文库上搜索。

1、解(1) 样本的似然函数为 当0 0, X1, X2, , Xn 是取自总体X的一组样本, 求 的极大似然估计量与矩估计量. 其中 0为未知参数, 例 设总体 X 的密度为故有对数似然函数:对 求导并令其为 0 可得似然方程: = 0 , 解得极大似然估计量: 令 (2) 解得矩估计量: 而区间估计正好弥补了点估计 的这个缺陷.无偏性有效性一致性 估计量的期望值等于未知参数的真值. 为了使估计的结论更可信, 需要引入区间估计. 评选标准 方差更小的无偏估计量. 样本 k 阶原点矩是总体 k 阶原点矩 的无偏估计量 ; 样本方差 S 2 是总体方差 2 的无偏估计量 ; 无偏估计量的函数未必是无

2、偏估计量 在 的所有线性无偏估计量中, 样本均值 X 是最有效的. 参数的点估计是用样本算得的一个值去估计未知参数. 使用 起来把握不大. 点估计值仅仅是未知参数的一个近似值, 它没有 反映出这个近似值的误差范围. 若我们根据一个实际样本 得到鱼数 N 的极大似然估计为 1000 条.一个可以想到的估计办法是:若我们能给 出一个区间,并告诉人们该区间包含未知参数 N的可靠度 (也称置 信系数).但实际上, N 的真值可能大于 1000 条, 也 可能小于1000条.7.3 单个正态总体均值与方差的置信区间也就是说,给出一个区间,使我们能以一定的可靠度相信区间 包含参数 。湖中鱼数的真值 这里所

3、说的“可靠程度”是用概率来度量 的, 称为置信概率,置信度或置信水平. 习惯上把置信水平记作 1- , 这里 是一个很小的正数. 譬如,在估计湖中鱼数的问题中, 根据置信水平1- , 可以 找到一个正数 , 例如, 通常可取置信 水平 = 0.95 或 0.9 等等.根据一个实际样本, 由给定的置信水平1- , 我们求出一个的 区间 , 使置信水平的大小是根据实际需要选定的.如何寻找这种区间?使得 我们选取未知参数的某个估计量 , 只要知道 的概率分布就可以确定 . 下面我们就来正式给出置信区间的定义, 并通过例子说明求 置信区间的方法.由不等式 可以解出 :这个不等式就是我们所求的置信区间

4、代入样本值所得的普通区间称为置信区 间的实现. 1) 为两个统计量(由样本完全确定的已知函数);X1, X2, , Xn 是取自总体 X 的样本, 对给定值 0 1, 满足 定义4 设 是总体 X 的待估参数, 分别称为置信下限和置信上限. 一、 置信区间的概念则称随机区间 为 的置信水平为 1- 的双侧置信区间 . 若统计量 和 置信度 置信概率 2) 是随机区间, 并非一个实现以 1- 的概率覆盖了 要求置信区间的长度尽可能短.估计的可靠度:即 P( )= 1- 要尽可能大. 可靠度与精度是一对矛盾, 一般是在 保证可靠度的条件下尽可能提高精度. 估计的精度 : 即要求区间置信的长度尽可能

5、短, 或能体现该要求的其它准则.要求 以很大的可能被包含在置信区间内 . 要求估计尽量可靠. 置信水平的概率意义:置信水平为 0.95 是指 100 组样本值所得置信区间的实现 中, 约有95个能覆盖 , 而不是一个实现以 0.95 的概率覆盖了 .估计要尽量可靠,估计的精度要尽可能的高: 只要知道 的概率分布就可以确定 . 如何根据实际样本, 由给定的置信水平1- , 求出一个区间 , 使根据置信水平1- , 可以 找到一个正数 , 二、置信区间的求法(一) 单个正态总体1. 均值 (1) 已知方差 2 1. 均值 1- 2 (1) 已知方差12,22 (二) 两个正态总体 2. 方差 2

6、(2) 未知方差 2 使得 我们选取未知参数的某个估计量 , 由不等式 可以解出 : 这个不等式就是我们所求的置信区间 分布的分位数 (1) 已知均值 (2) 未知均值 (2) 未知方差12,22 2. 方差 12/22 (1) 已知均值 1, 2 (2) 未知均值 1, 2 ,但相等! 对于给定的置信水平, 根据估计量U 的分布, 确定 一个区间, 使得 U 取值于该区间的概率为置信水平.X , S 2 分别是其样本 均值和样本方差, X N( , 2/n), 求参数 、 2 的置信水平为1- 的置信区间. 设 X1, , Xn 是总体 X N( , 2)的样本, 确定未知参数的 估计量及其

7、函数的分布是 的无偏估计量, 由分布求分位数 即得置信区间(一) 单个正态总体置信区间的求法(1)已知方差 2 时故可用 X 作为 EX 的一个估计量, N(0, 1), 对给定的置信度 1- , 按标准正态分布的双侧 分位数的定义 查正态分布表可得 u / 2 , 由u / 2确 定置信区间有了分布就可求出U 取值于任意区间的概率简记为 由抽样分布定理知 1. 均值 的置信区间 是求什么参数的置信区间? 置信水平 1- 是多少? 1. 寻找未知参数 的一个良好的点估计量 (X1, X2, , Xn );确定待估参数估计量函数 U( ) 的分布 ; 求置信区间首先要明确问题:2. 对于给定的置

8、信水平 1- , 由概率 ( , ) 就是 的 100(1- ) 的置信区间. 一般步骤如下: 3. 由分位数|U| x 确定置信区间 ( , ). 查表求出分布的分位数 x , 总体分布的形式是否已知,是怎样的 类型,至关重要. 某乡农民在联产承包责任制前人均纯收入 X(单 位:元), 求 的置信水 平为 0. 95 的置信区间.推行联产承包责任制后, 在该乡抽得 n =16 的样本, 且 X N ( , 252). 解 由于 =0.05 , 查正态分布表得 例1得 x =325元, 假设 2 = 25 2 没有变化, 即得置信区间 ( 312. 75 , 337. 25 ).同一置信水平下

9、的置信区间不唯一, 如在上例中取 = 0. 01 + 0. 04 , 由正态分布上侧分位数定义知 查表知 u0. 025 = 1. 96 , 当然区间长度越短的估计, 精度就越高. 其长度也不相等. 区间长度为 24. 25 长度为 25. 5 谁是精度最高的? 由于标准正态分布密度函数的图形是单峰且对称的, 在保持面积不变的条件下, 以对称区间的长度为最短 ! ! 但的长度是最短的, l 与 n , 的关系: 可知, 置信区间的长度 l 为: 由置信区间公式 l 随着 的减小而增大; 20 若给定 , l 随着 n 的增大而减小; 同一置信水平下的置信区间不唯一. 其长度也不相等. 故我们总

10、取它作为置信水平为 1- 的置信区间. 若给定 n , 且由于 l 与 成反比, 减小的速度并不快, 例如, n 由 100 增至 400 时, l 才能减小一半. 则 u / 2 越大, l 就越大, 这时 就越小. 10 (u / 2)就越大,一般地, 在概率密度为单峰且对称的情形下, a =-b 对应的 置信区间的长度为最短.例2: 某厂生产的零件长度 X 服从 N( , 0.04),现从 该厂生产的零件中随机抽取6个,长度测量值如下( 单位:毫米): 14.6, 15.l, 14.9, 14.8, 15.2, 15.1.求: 的置信系数为0.95的区间估计。 解:n = 6, = 0.

11、05,z/2 = z0.025 = 1.96,2=0.22 . 所求置信区间为故不能采用已知方差的均值估计方法 由于 与 有关, 但其解决的思路一致. 由于 S 2是 2 的无偏估计量, 查 t 分布表确定上侧 /2 分位数令 T = (2) 未知方差 用 分布的分位数求 的置信区间. 故可用 S 替代 的估计量: S t(n-1), 即为 的置信度为 1- 的区间估计. 2 时 由抽样分布定理知 实用价值更大 ! t / 2(n -1), 测定总体服从正态 分布, 求总体均值 的置信水平为 0. 95 的置信区间.解 由于 /2 =0. 025 , 查 t 分布表得 例3 为确定某种溶液中甲

12、醛浓度, 且其 4 个独立测量值的平均值 x = 8. 34%, 样本标准差 s= 0. 03%, 即得置信区间自由度 n-1= 3, t 0. 025 = 3. 182, 将 x = 8. 34 % 代入 得 (2) 未知时 所以 2的置信水平为1- 的区间估计为因为 2 的无偏估计为 S 2 , 2. 方差 2 的置信区间的求法 由抽样分布定理知 2 = 由确定 2 分布的上侧 /2 分位数找一个含 与S, 但不含 , 且分布已知的统计量为了计算简单,在概率密度不对称的情形下,如 2 分布,F 分布, 习惯上仍取对称的分位点来计算未知参数的置信区间.并不是最短的置信区间 /2 /2测定总体

13、服从正态 分布, 求总体均值 的置信水平为 0. 95 的置信区间.解 由于 /2 =0. 025 , 查 2 分布表得例4 为确定某种溶液中甲醛浓度, 且其 4 个独立测量值的平均值 x = 8. 34%, 样本标准差 s= 0. 03%, 故 2 的置信区间为自由度 n-1= 3, 得将 s 2 = 0. 0009代入求总体方差 2和标准差 的置信水平为 0. 95 的置信区间.故 的置信区间为在实际应用中,经常会遇到两个正态总体的区间 估计问题。于是,评价新技术的效果问题,就归结为研究 两个正态总体均值之差 1-2 的问题。例如:考察一项新技术对提高产品的某项质量指 标的作用,将实施新技术前的产品质量指标看成正 态总体 N(1, 12),实施新技术后产品质量指标看成 正态总体 N(2, 22)。设 X1, , Xm分别是总体 X N( 1 ,12)的样本, Y1, , Yn分别 是总

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号