置信区间ppt课件

上传人:大米 文档编号:592250683 上传时间:2024-09-20 格式:PPT 页数:26 大小:1.04MB
返回 下载 相关 举报
置信区间ppt课件_第1页
第1页 / 共26页
置信区间ppt课件_第2页
第2页 / 共26页
置信区间ppt课件_第3页
第3页 / 共26页
置信区间ppt课件_第4页
第4页 / 共26页
置信区间ppt课件_第5页
第5页 / 共26页
点击查看更多>>
资源描述

《置信区间ppt课件》由会员分享,可在线阅读,更多相关《置信区间ppt课件(26页珍藏版)》请在金锄头文库上搜索。

1、解解(1) 样本的似然函数本的似然函数为 当当0x i 0, X1, X2, , Xn 是取自是取自总体体X的一的一组样本本, 求求 的极大似然估的极大似然估计量与矩估量与矩估计量量. 其中其中 0为未知参数未知参数, 例例 设总体设总体 X 的密度为的密度为故有故有对数似然函数:数似然函数:对 求求导并令其并令其为 0 可得似然方程:可得似然方程: = 0 , 解得极大似然估解得极大似然估计量:量: 令令 (2) (2) 解得矩估解得矩估计量:量: 而区而区间估估计正好弥正好弥补了点估了点估计的的这个缺陷个缺陷.无偏性无偏性有效性有效性一致性一致性 估估计量的期望量的期望值等于未知参数的真等

2、于未知参数的真值. 为了使估了使估计的的结论更可信更可信, 需求引入区需求引入区间估估计. 评选规范范 方差更小的无偏估方差更小的无偏估计量量. 样本本 k k 阶原点矩是原点矩是总体体 k k 阶原点矩原点矩 的无偏估的无偏估计量量 ; ; 样本方差本方差 S 2 S 2 是是总体方差体方差 2 2 的无偏估的无偏估计量量 ; ; 无偏估无偏估计量的函数未必是无偏估量的函数未必是无偏估计量量 在在 的一切的一切线性无偏估性无偏估计量中量中, 样本均本均值 X 是最有效的是最有效的. 参数的点估参数的点估计是用是用样本算得的一个本算得的一个值去估去估计未知参数未知参数. 运用运用起来把握不大起

3、来把握不大. 点估点估计值仅仅是未知参数的一个近似是未知参数的一个近似值, 它没有它没有反映出反映出这个近似个近似值的的误差范差范围. 假假设我我们根据一个根据一个实践践样本得到本得到鱼数数 N 的极大似然估的极大似然估计为 1000 条条. 一个可以想到的估一个可以想到的估计方法是:假方法是:假设我我们能能给出一个区出一个区间,并通知人并通知人们该区区间包含未知参数包含未知参数 N的可靠度的可靠度 (也称置也称置信系数信系数). 但但实践上践上, N 的真的真值能能够大于大于 1000 条条, 也也能能够小于小于1000条条.7.3 7.3 单个正个正态总体均体均值与方差的置信区与方差的置信

4、区间 也就是也就是说,给出一个区出一个区间,使我,使我们能以一定的可靠度置信区能以一定的可靠度置信区间包含参数包含参数 。湖中湖中鱼数的真数的真值 这里所里所说的的“可靠程度是用概率来度量可靠程度是用概率来度量的的, 称称为置信概率,置信度或置信程度置信概率,置信度或置信程度.习惯上把置信程度上把置信程度记作作 1- , 这里里 是一个很小的正数是一个很小的正数. 譬如,在估譬如,在估计湖中湖中鱼数的数的问题中中, 根据置信程度根据置信程度1- , 可可以找到一个正数以找到一个正数 , 例如例如, 通常可取置信通常可取置信程度程度 = 0.95 或或 0.9 等等等等. 根据一个根据一个实践践

5、样本本, 由由给定的置信程度定的置信程度1- , 我我们求出一个的求出一个的区区间 , 使使置信程度的大小是根据实践需求选定的置信程度的大小是根据实践需求选定的.如何如何寻觅这种区种区间?使得使得 我我们选取未知参数的某个估取未知参数的某个估计量量 , 只需知道只需知道 的概率分布就可以确定的概率分布就可以确定 . . 下面我下面我们就来正式就来正式给出置信区出置信区间的定的定义, 并并经过例子例子阐明求明求置信区置信区间的方法的方法.由不等式由不等式 可以解出可以解出 :这个不等式就是我个不等式就是我们所求的置信区所求的置信区间 代入代入样本本值所得的普通区所得的普通区间称称为置信区置信区间

6、的的实现. 1 为两个两个统计量由量由样本完全确定的知函数;本完全确定的知函数; X1, X2, , Xn 是取自是取自总体体 X 的的样本本, 对给定定值 0 1, 满足足 定定义4 设 是是总体体 X 的待估参数的待估参数, 分分别称称为置信下限和置信上限置信下限和置信上限. 一、一、 置信区间的概念置信区间的概念那么称随机区那么称随机区间 为 的置信程度的置信程度为 1- 的双的双侧置信区置信区间 . 假假设统计量量 和和 置信度置信度 置信概率置信概率 2 是随机区是随机区间, 并非一个并非一个实现以以 1- 的概率覆盖了的概率覆盖了 要求置信区要求置信区间的的长度尽能度尽能够短短.

7、估估计的可靠度:的可靠度: 即即 P( )= 1- 要尽能要尽能够大大. 可靠度与精度是一对矛盾可靠度与精度是一对矛盾, 普通是在普通是在保证可靠度的条件下尽能够提高精度保证可靠度的条件下尽能够提高精度. 估估计的精度:的精度: 即要求区即要求区间置信的置信的长度尽能度尽能够短短, 或能表达或能表达该要求的其它准那么要求的其它准那么.要求要求 以很大的能以很大的能够被包含在置信区被包含在置信区间内内 .要求估要求估计尽量可靠尽量可靠. 置信程度的概率意置信程度的概率意义: 置信程度置信程度为 0.95 是指是指 100 组样本本值所得置信区所得置信区间的的实现中中, 约有有95个能覆盖个能覆盖

8、 , 而不是一个而不是一个实现以以 0.95 的概率覆盖了的概率覆盖了 .估估计要尽量可靠要尽量可靠,估估计的精度要尽能的精度要尽能够的高:的高: 只需知道只需知道 的概率分布就可以确定的概率分布就可以确定 . . 如何根据如何根据实践践样本本, 由由给定的置信程度定的置信程度1- , 求出一个区求出一个区间 , 使使 根据置信程度根据置信程度1- , 可以可以找到一个正数找到一个正数 , 二、置信区间的求法二、置信区间的求法( (一一) ) 单个正个正态总体体1. 均均值 (1) (1) 知方差知方差 2 2 1. 均均值 1- 2 (1) (1) 知方差知方差 12,12, 22 22 (

9、 (二二) ) 两个正两个正态总体体 2. 方差方差 2 (2) (2) 未知方差未知方差 2 2 使得使得 我我们选取未知参数的某个估取未知参数的某个估计量量 , 由不等式由不等式 可以解出可以解出 :这个不等式就是我个不等式就是我们所求的置信区所求的置信区间 分布的分位数分布的分位数 (1) (1) 知均知均值 (2) (2) 未知均未知均值 (2) (2) 未知方差未知方差 12,12, 22 22 2. 方差方差 12/ 22 (1) (1) 知均知均值 1, 1, 2 2 (2) (2) 未知均未知均值 1, 1, 2 2 , ,但相等但相等! ! 对于给定的置信程度对于给定的置信程

10、度, 根据估计量根据估计量U 的分布的分布, 确定确定一个区间一个区间, 使得使得 U 取值于该区间的概率为置信程度取值于该区间的概率为置信程度. X , S 2 分分别是其是其样本均本均值和和样本方差本方差, X N( , 2/n), 求参数求参数 、 2 的置信程度的置信程度为1- 的置信区的置信区间. 设 X1, , Xn 是是总体体 X N( , 2)的的样本本, 确定未知参数的确定未知参数的估计量及其函数的分布估计量及其函数的分布 是是 的无偏估的无偏估计量量, , 由分布求分位数由分布求分位数 即得置信区即得置信区间( (一一) ) 单个正态总体置信区间的求法单个正态总体置信区间的

11、求法(1)(1)知方差知方差 2 2 时 故可用故可用 X 作作为 EX 的一个估的一个估计量量, N(0, 1), 对给定的置信度定的置信度 1- ,按按规范正范正态分布的双分布的双侧 分位数的定分位数的定义查正正态分布表可得分布表可得 u / 2 , 由由u / 2确确定置信区间定置信区间 有了分布就可求出有了分布就可求出U 取取值于恣意区于恣意区间的概率的概率简记为 由抽由抽样分布定理知分布定理知 1. 均均值 的置信区的置信区间 是求什么参数的置信区是求什么参数的置信区间? 置信程度置信程度 1- 是多少是多少? 1. 1. 寻觅未知参数未知参数 的一个良好的点估的一个良好的点估计量量

12、 (X1, X2, , Xn ); (X1, X2, , Xn ); 确定待估参数估确定待估参数估计量函数量函数 U( U( ) ) 的分布的分布 ; ; 求置信区间首先要明确问题:求置信区间首先要明确问题:2. 对于于给定的置信程度定的置信程度 1- , 由概率由概率 ( , ) 就是就是 的的 100(1- ) 的置信区的置信区间. 普通步普通步骤如下如下: 3. 3. 由分位数由分位数|U|U| x x 确定置信区确定置信区间 ( ( , , ). ). 查表求出分布的分位数表求出分布的分位数 x , 总体分布的方式能否知体分布的方式能否知, ,是怎是怎样的的类型型, ,至关重要至关重要

13、. . 某乡农民在联产承包责任制前人均纯收入某乡农民在联产承包责任制前人均纯收入 X( X(单单位位: :元元), ), 求求 的置信的置信程度程度为 0. 95 的置信区的置信区间. 推行推行联产承包承包责任制后任制后, 在在该乡抽得抽得 n =16 的的样本本, 且且 X N ( , 252). 解解 由于由于 =0.05 =0.05 , , 查正正态分布表得分布表得 例例1 得得 x =325元元, 假假设 2 = 25 2 2 = 25 2 没有没有变化化, , 即得置信区即得置信区间 ( 312. 75 , 337. 25 ). 同一置信程度下的置信区同一置信程度下的置信区间不独一不

14、独一, 如在上例中取如在上例中取 = 0. 01 + 0. 04 , 由正由正态分布上分布上侧分位数定分位数定义知知 查表知表知 u0. 025 = 1. 96 , 当然区当然区间长度越短的估度越短的估计, 精度就越高精度就越高. 其其长度也不相等度也不相等. 区间长度为区间长度为 24. 25 长度为长度为 25. 5 谁是精度最高的?是精度最高的? 由于由于规范正范正态分布密度函数的分布密度函数的图形是形是单峰且峰且对称的称的, 在在坚持面持面积不不变的条件下的条件下, 以以对称区称区间的的长度度为最短最短 ! ! 但但的的长度是最短的度是最短的, l 与与 n , 的关系:的关系: 可知

15、可知, 置信区置信区间的的长度度 l 为: 由置信区由置信区间公式公式 l 随着随着 的减小而增大的减小而增大; 20 假假设给定定 , l 随着随着 n 的增大而减小的增大而减小; 同一置信程度下的置信区间不独一同一置信程度下的置信区间不独一. 其长度也不相等其长度也不相等. 故我故我们总取它作取它作为置信程度置信程度为 1- 的置信区的置信区间. 假假设给定定 n , 且由于且由于 l 与与 成反比成反比, 减小的速度并不快减小的速度并不快, 例如例如, n 由由 100 增至增至 400 时, l 才干减小一半才干减小一半. 那么那么 u / 2 越大越大, l 就越大就越大, 这时 就

16、越小就越小. 10 (u / 2)就越大就越大, 普通地普通地, , 在概率密度在概率密度为单峰且峰且对称的情形下称的情形下, a =-b , a =-b 对应的的置信区置信区间的的长度度为最短最短. .例例2: 某厂消某厂消费的零件的零件长度度 X 服从服从 N( , 0.04),现从从该厂消厂消费的零件中随机抽取的零件中随机抽取6个,个,长度丈量度丈量值如下如下(单位位:毫米毫米): 14.6, 15.l, 14.9, 14.8, 15.2, 15.1.求求: 的置信系数的置信系数为0.95的区的区间估估计。 解:解:n = 6n = 6, = 0.05 = 0.05,z z/2 = z0

17、.025 = 1.96/2 = z0.025 = 1.96, 2=0.22 . 2=0.22 . 所求置信区所求置信区间为 故不能采用知方差的故不能采用知方差的均均值估估计方法方法 由于由于 与与 有关有关, 但其但其处理的思理的思绪一致一致. 由于由于 S 2是是 2 的无偏估的无偏估计量量, 查 t 分布表确定上分布表确定上侧 /2 分位数分位数令令 T = (2) (2) 未知方差未知方差 用用 分布的分位数求分布的分位数求 的置信区的置信区间. 故可用故可用 S 替代替代 的估的估计量量: S t(n-1), 即即为 的置信度的置信度为 1- 的区的区间估估计. 2 时时 由抽由抽样分

18、布定理知分布定理知 适用价适用价值更大更大 ! t / 2(n -1), 测定定总体服从正体服从正态分布分布, 求求总体均体均值 的置信程度的置信程度为 0. 95 的置信区的置信区间.解解 由于由于 /2 =0. 025 /2 =0. 025 , , 查 t 分布表得分布表得 例例3 为确定某种溶液中甲醛浓度为确定某种溶液中甲醛浓度, 且其且其 4 个独立丈量个独立丈量值的平均的平均值 x = 8. 34%, 样本本规范差范差 s= 0. 03%, 即得置信区即得置信区间自在度自在度 n-1= 3, t 0. 025 = 3. 182, 将将 x = 8. 34 % 代入代入 得得 (2)

19、(2) 未知未知时 所以所以 2的置信程度的置信程度为1- 的区的区间估估计为由于由于 2 的无偏估的无偏估计为 S 2 , 2. 方差方差 2 的的置信区间的求法置信区间的求法 由抽由抽样分布定理知分布定理知 2 = 由由确定确定 2 分布的上分布的上侧 /2 分位分位数数找一个含找一个含 与与S, 但不含但不含 , 且分布知的统计量且分布知的统计量 为了了计算算简单, ,在概率密度不在概率密度不对称的情形下称的情形下, ,如如 2 2 分布分布,F ,F 分分布布, ,习惯上仍取上仍取对称的分位点来称的分位点来计算未知参数的置信区算未知参数的置信区间. . 并不是最短的置信区间并不是最短的

20、置信区间 /2 /2 测定总体服从正态测定总体服从正态分布分布, 求求总体均体均值 的置信程度的置信程度为 0. 95 的置信区的置信区间.解解 由于由于 /2 =0. 025 /2 =0. 025 , , 查 2 分布表得分布表得例例4 为确定某种溶液中甲醛浓度为确定某种溶液中甲醛浓度, 且其且其 4 个独立丈量个独立丈量值的平均的平均值 x = 8. 34%, 样本规范差样本规范差 s= 0. 03%, 故故 2 的置信区的置信区间为自在度自在度 n-1= 3, 得得将将 s 2 = 0. 0009代入代入求求总体方差体方差 2和和规范差范差 的置信程度的置信程度为 0. 95 的置信区的

21、置信区间.故故 的置信区的置信区间为 在在实践践运运用用中中,经常常会会遇遇到到两两个个正正态总体体的区的区间估估计问题。 于是,评价新技术的效果问题,就归结为研讨两个正态总体均值之差 1-2 的问题。 例例如如:调查一一项新新技技术对提提高高产品品的的某某项质量量目目的的的的作作用用,将将实施施新新技技术前前的的产质量量量量目目的的看看成成正正态总体体 N(N(1, 1, 12)12),实施施新新技技术后后产质量量量量目目的的看看成成正正态总体体 N(N(2, 2, 22)22)。 设 X1, , Xm分分别是是总体体 X N( 1 , 12)的的样本本, Y1, , Yn分分别是是总体体

22、Y N( 2 , 22)的的样本本, X , Y 分分别是是总体体 X 和和 Y 的的样本均本均值, 求参数求参数 1- 2 和和 12/ 22 的置信程度的置信程度为 1- 的置信区的置信区间. 由于由于X , Y 分分别是是1, 2 的无偏估的无偏估计量量, 即得置信区即得置信区间( (二二) ) 两个正态总体两个正态总体(1)(1)知方差知方差 12,12, 22 22 时 故可用故可用 X -Y 作作为 1- 2 的一个估的一个估计量量, N(0, 1), 对给定的置信度定的置信度 1- ,查正正态分布表可得分布表可得 u / 2 , 由抽由抽样分布定理知分布定理知 1. 均均值 1-

23、 2 的置信区的置信区间 SX2 , SY2分分别是是总体体 X 和和 Y 的的样本方差本方差, 置信区间的求法置信区间的求法 设 X1, , Xm分分别是是总体体 X N( 1 , 12)的的样本本, Y1, , Yn分分别是是总体体 Y N( 2 , 22)的的样本本, X , Y 分分别是是总体体 X 和和 Y 的的样本均本均值, 求参数求参数 1- 2 和和 12/22 的置信程度为的置信程度为 1- 的置信区间的置信区间. 即得置信区即得置信区间( (二二) ) 两个正态总体置信区间的求法两个正态总体置信区间的求法 (2)(2)未知方差未知方差 12,12, 22 , 22 , 但但

24、 12 = 12 = 22 = 22 = 2 2时 仍用仍用 X - Y 作作为 1- 2 的一个估的一个估计量量, t(n+m-2), 对给定的置信度定的置信度 1- ,查 t 分布表可得分布表可得 由抽由抽样分布定理知分布定理知 1. 均值差均值差 1- 2 的置信区间的置信区间 SX2 , SY2分别是总体分别是总体 X 和和 Y 的样本方差的样本方差, t / 2(n+m-2), 例例5:某公司利用两条自:某公司利用两条自动化流水化流水线灌装灌装矿泉水。泉水。设这两条流两条流水水线所装所装矿泉水的体泉水的体积 (单位位:毫升毫升) XN(1, 2) 和和 YN(2, 2)。现从消从消费

25、线上分上分别抽取抽取 X1, X2, X12 和和 Y1, Y2, , Y17,样本均本均值与与样本方差分本方差分别为:求求 1- 1- 2 2 的置信系数的置信系数为0.950.95的区的区间估估计。解:解:m=12, n=17, = 0.05,且,且查 t 分布表,得分布表,得 tm+n-2( /2) = t27(0.025)=2.05.因此,置信度因此,置信度为 1- 的置信区的置信区间:例例6 (比比较棉花种棉花种类的的优劣劣):假:假设用甲、乙两种棉花用甲、乙两种棉花纺出的棉出的棉纱强度分度分别为 XN(1, 2.182)和和Y N(2, 1.762)。实验者从者从这两种棉两种棉纱中

26、分中分别抽取抽取样本本 X1, X2 , X200 和和 Y1, Y2, , Y100,样本均本均值分分别为: 求求 1-2 的置信系数的置信系数为 0.95 的区的区间估估计。 解解: 1=2.18, 2=1.76, m=200, n=100, =0.05, 1- 2 的置信系数的置信系数为 1- 的置信区的置信区间为:设同上设同上, 求参数求参数 12/22 的置信程度为的置信程度为 1- 的置信区间的置信区间. 即得即得 12/ 22 的置信区的置信区间 ( (二二) ) 两个正态总体置信区间的求法两个正态总体置信区间的求法 (2)(2)未知未知 1 , 1 , 2 2 时 F(m-1,

27、 n-1), 对给定的置信度定的置信度 1- ,查 F 分布表可得上分布表可得上侧分位数分位数由抽由抽样分布定理知分布定理知 2. 方差比方差比 12/22 的置信区间的置信区间 F / 2(m-1, n-1), F1- / 2(m-1, n-1), 求两求两总体方差比体方差比 12/ 22 的置信程度的置信程度为 0. 90 的置信区的置信区间.称重后所的称重后所的样本方差分本方差分别为 sx2= 0.0125, sy2= 0. 01, 假定所假定所装番茄装番茄酱的分量的分量 X 与与 Y 分分别服从正服从正态分布分布N( 1 , 12)和和 N( 2 , 22), 解解 由于由于 /2 =

28、0. 05 /2 =0. 05 , , 查 F 分布表得分布表得 例例7 某厂用两条流水线消费番茄酱小包装某厂用两条流水线消费番茄酱小包装, 现从两条流水从两条流水线上各随机抽取上各随机抽取样本容量分本容量分别为 m=6 , n=7 的的样本本, 将条件代入得将条件代入得 12/ 22 的置信区的置信区间为 ( 0. 2847 , 6. 1875 ).自在度自在度 m-1=5, n-1= 6, 主要根据主要根据抽样分布抽样分布Th( (二二) )两个两个总体体 由由 的概率分布和置信程度的概率分布和置信程度 1- 1- , , 确定其相确定其相应的分位数的分位数 x x /2 ; /2 ; 小

29、小结正正态总体置信区体置信区间的求法的求法( (一一) )单个个总体体均均值 知方差知方差 2 均均值差差 1- 2 知方差知方差 12, 22 方差方差 2 未知方差未知方差 2 解得所求的置信区解得所求的置信区间 根据未知参数的无偏估根据未知参数的无偏估计量量, 确定其某个估确定其某个估计量量 ; 由不等式由不等式 知均知均值 未知均未知均值 未知方差未知方差 12, 22 方差比方差比 12/ 22 知均知均值 1, 2 未知均未知均值 1, 2 但相等但相等! ! X1, , Xn 是取自是取自 X 的的样本本, 那么称随机区那么称随机区间(- , )为 的置信程度的置信程度为 1-

30、的的单侧置信区置信区间 , 但有些但有些实践践问题, 人人们关关怀的只是参数在一个方向的界限的只是参数在一个方向的界限. 这时, 可将置信上限取可将置信上限取为+, 而只着眼于置而只着眼于置信下限信下限, 上述置信区上述置信区间中置信限都是双中置信限都是双侧的的, 例如例如对于于设备、元件的运用寿命来、元件的运用寿命来说, 平均寿命平均寿命过长没什么没什么问题, 过短就有短就有问题了了.三、单侧置信区间三、单侧置信区间定定义 满足足这样求得的置信区求得的置信区间叫叫单侧置信区置信区间. 对给定定值 0 1, 满足足 设 是是总体体 X 的待估参数的待估参数, 称称 为单侧置信下限置信下限 ;

31、那么称随机区那么称随机区间( ,+)为 的置信程度的置信程度为 1- 的的单侧置信区置信区间 , 称称 为单侧置信上限置信上限.假假设统计量量 假假设统计量量 求求单侧置信区置信区间的思的思绪完全同于双完全同于双侧的情形的情形 记录其磨坏其磨坏时所行所行驶路程路程(单位位:公里公里), 问该种种轮胎平均行胎平均行驶路程至少是多少路程至少是多少( =0. 05 )?解解 由于由于 2 2 未知未知, , 查 t 分布表可得分布表可得满足条件足条件 的上的上侧分位数分位数例例8 从一批汽车轮胎中随机地取从一批汽车轮胎中随机地取16只作磨损实验只作磨损实验, 算得算得样本均本均值 x = 41116 , 即得置信度即得置信度为 0. 95 的的单侧置信下限置信下限 t 0. 05 (15)= 1. 7531, 将将 x = 41116, s= 6346 代入代入 得得 设此此样本来自正本来自正态总体体 N( , 2), , 均未均未知知, t(n-1), 由抽由抽样分布定理知随机分布定理知随机变量量 样本本规范差范差 s= 6346 . = 38334, 故故该种种轮胎平均行胎平均行驶路程不少于路程不少于38334公里公里, 其置信概率其置信概率为0. 95.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号