《概率论与数理统计课件:ch6-3置信区间》由会员分享,可在线阅读,更多相关《概率论与数理统计课件:ch6-3置信区间(21页珍藏版)》请在金锄头文库上搜索。
1、1Probability and Statistics Chapter 6 Parameter Estimation 6.1 点估计问题概述点估计问题概述6.2 估计量的常用方法估计量的常用方法6.3 置信区间置信区间6.4 正态总体的置信区间正态总体的置信区间教学内容教学内容 Chapter 6 Parameter Estimation 第六章第六章 参数估计参数估计Content 2Probability and Statistics Chapter 6 Parameter Estimation 引言引言前面讨论了参数的点估计,前面讨论了参数的点估计, 它是用它是用样本值算出的一样本值算出
2、的一个值去估计未知参数个值去估计未知参数. 即即点估计值仅仅是未知参数点估计值仅仅是未知参数的一个近似值的一个近似值, 它它没有给出这个近似值的没有给出这个近似值的误差范围误差范围.例如,例如,在在估计某湖泊中鱼的数量的问题中,估计某湖泊中鱼的数量的问题中, 若根据若根据一个实际样本,一个实际样本, 利用最大似然估计法估计出鱼的数利用最大似然估计法估计出鱼的数量为量为50000条,条, 这种估计结果使用起来把握不大这种估计结果使用起来把握不大.际上,际上,于于50000条,条, 且且可能偏差较大可能偏差较大. 若能若能给一个给一个估计区计,估计区计,实实鱼的数量的真值可能大于鱼的数量的真值可能
3、大于50000条,条, 也可能小也可能小3Probability and Statistics Chapter 6 Parameter Estimation 引言引言让让我们能我们能较大把握地较大把握地 (其程度可用概率来度量之其程度可用概率来度量之)相信鱼的数量的真值被含在这个区间内相信鱼的数量的真值被含在这个区间内,计显然更有计显然更有实用价值实用价值.本节将本节将引入的另一类估计,引入的另一类估计, 即即区间估计区间估计.在区间估计在区间估计理论中,理论中, 被被广泛接受的一种观点是广泛接受的一种观点是置信区间置信区间,这样的估这样的估它是由奈它是由奈曼曼(Neymann)于于1943年
4、提出的年提出的.4Probability and Statistics Chapter 6 Parameter Estimation 置信区间的概念置信区间的概念定义定义 设设为为总体分布的未知参数,总体分布的未知参数,取自总体取自总体的的一个样本,一个样本, 对对给定的数给定的数若若存在统计量存在统计量使得使得则称则称随机区间随机区间为为的的双双侧置信侧置信区间区间, 称称为为置信度置信度,是是又又分别称分别称与与为为的的双双侧置信下侧置信下限限与与双侧置信上限双侧置信上限.5Probability and Statistics Chapter 6 Parameter Estimation
5、置信区间的概念置信区间的概念注注:1. 置信度置信度的的含义:含义: 在在随机抽样中,随机抽样中, 若重复若重复抽样多次,抽样多次, 得到样本得到样本的的多个样本值多个样本值对应每个样本值都确定了一个置信区对应每个样本值都确定了一个置信区间间每个这样的区间要么包含了每个这样的区间要么包含了 的真值的真值,不包含不包含的真的真值值. 根据根据伯努利大数定理伯努利大数定理,k充分大时,充分大时,个,个,当所样次数当所样次数这些区间中包含这些区间中包含的真值的区间大约有的真值的区间大约有要么要么不包含不包含 的真值的的真值的区间大约有区间大约有个个.6Probability and Statisti
6、cs Chapter 6 Parameter Estimation 置信区间的概念置信区间的概念例如,例如,若令若令重复抽样重复抽样100次,次, 则则其中大约有其中大约有95个区间包含个区间包含 的真值的真值, 大约有大约有5个区间个区间不包含不包含的真的真值值.2.置信区间置信区间也是对未知参数也是对未知参数的的一种估计一种估计,区间的长度意味着误差,区间的长度意味着误差, 故故区间估计与点估计是互区间估计与点估计是互补的两种参数估计补的两种参数估计. 7Probability and Statistics Chapter 6 Parameter Estimation 置信区间的概念置信区
7、间的概念3.置信度与估计精度是一对矛盾置信度与估计精度是一对矛盾, 置信度置信度越越大大, 置信区间置信区间包含包含的真值的的真值的概率就越大概率就越大, 但但区间区间的的长度越长长度越长, 对对未知叁数未知叁数的估计精度就的估计精度就越差越差. 反之反之,对对参数参数 的的估计精度越高估计精度越高,置信区间置信区间长度就越小,长度就越小,包含包含的真值的的真值的概率就越低概率就越低,度度越越小小. 一般准则一般准则是:是:在在保证置信度的条件下尽可能提高估保证置信度的条件下尽可能提高估计精度计精度.置信置信8Probability and Statistics Chapter 6 Param
8、eter Estimation 寻求置信区间的方法寻求置信区间的方法基本思想基本思想: 在点在点估计的基础上估计的基础上, 构造合适的含样本构造合适的含样本有待估参数有待估参数的的函数函数且且的的分布已知分布已知,给定的置信度导出置信区间给定的置信度导出置信区间. 一般步骤一般步骤:(1)(2)且且的的分布已知;分布已知;并针对并针对的的某个较优估计量某个较优估计量选取未知参数选取未知参数构造一个依赖于样本与参数构造一个依赖于样本与参数的函数的函数围绕围绕9Probability and Statistics Chapter 6 Parameter Estimation 寻求置信区间的方法寻求
9、置信区间的方法(3)确定确定与与使使对给定的置信水平对给定的置信水平与与在在常用分布情况下,常用分布情况下, 这可由分位数表查这可由分位数表查得;得;(4)则则就是就是的的置信度为置信度为的的置信区间置信区间.通常可选取满足通常可选取满足的的作作恒等变形化为恒等变形化为对不等式对不等式10Probability and Statistics Chapter 6 Parameter Estimation 例例1 设设总体总体为已知为已知, ,为未知为未知, 设设是是来自来自的样本的样本, , 求求的的置信水平为置信水平为的的置信区间置信区间. .解解 已知已知是是的无偏估计的无偏估计, ,而而不
10、依赖于任何未知参数不依赖于任何未知参数. . 按标准正态分布按标准正态分布的双侧的双侧分位数分位数的定义的定义, ,且且有有11Probability and Statistics Chapter 6 Parameter Estimation 例例1 设设总体总体为已知为已知, ,为未知为未知, 设设是是来自来自的样本的样本, , 求求的的置信水平为置信水平为的的置信区间置信区间. .解解这样这样, , 就就得到了得到了 的的一个置信水平为一个置信水平为的置信区间的置信区间常写成常写成即即若取若取即即及及表表得得则则得到一个置信水平为得到一个置信水平为0.95查查的置信区间的置信区间12Pro
11、bability and Statistics Chapter 6 Parameter Estimation 例例1 设设总体总体为已知为已知, ,为未知为未知, 设设是是来自来自的样本的样本, , 求求的的置信水平为置信水平为的的置信区间置信区间. .解解则则进一步得到一个置信水平为进一步得到一个置信水平为0.95的置信区间的置信区间这个区间的含义是这个区间的含义是: : 若若反复抽样多次反复抽样多次, , 每组样本值均每组样本值均确定一个区间确定一个区间, , 在在这些区间中这些区间中, , 包含包含的的约占约占95%, ,若由若由一个样本值得样本均值的观察值一个样本值得样本均值的观察值或
12、者说该区间属于包含或者说该区间属于包含的的区间的可信程度为区间的可信程度为95%. . 13Probability and Statistics Chapter 6 Parameter Estimation 分布参数的置信区间分布参数的置信区间考虑考虑分布情形,分布情形,设其设其总体总体的的分布律为分布律为现求现求的的置信度为置信度为的的置信区间置信区间. 已知已知分布的均值和方差分别为分布的均值和方差分别为设设是是总体总体的的一个样本,一个样本, 由由中心极中心极限定理限定理知,知, 当当充分大时,充分大时,14Probability and Statistics Chapter 6 Par
13、ameter Estimation 近似服从近似服从分布分布, 对对给定的置信度给定的置信度有有经经不等式变形得不等式变形得其中其中解式中不等式得解式中不等式得其中其中15Probability and Statistics Chapter 6 Parameter Estimation 解式中不等式得解式中不等式得其中其中于是于是可作为可作为 的置信度为的置信度为的置信区间的置信区间.16Probability and Statistics Chapter 6 Parameter Estimation 例例2 设抽设抽自自一大批产品的一大批产品的100个样品中个样品中, , 得得一级品一级品6
14、0个个, , 求这批求这批产品的一级品率产品的一级品率的的置信水平为置信水平为0.95的置的置信区间信区间.解解 一级品率一级品率是是分布的参数分布的参数, , 此处此处现按现按上述方法来求上述方法来求的置信区间的置信区间, , 其中其中, ,于是于是故得故得的的一个置信水平为一个置信水平为的近似置信区间为的近似置信区间为0.9517Probability and Statistics Chapter 6 Parameter Estimation 单侧单侧置信区间置信区间前面讨论的置信区间前面讨论的置信区间称为双侧置信区间称为双侧置信区间,在有些实际问题中只要考虑选取满足在有些实际问题中只要考
15、虑选取满足或或的的对对不等式作变形后化为不等式作变形后化为或或从而得到形如从而得到形如或或的的置信区间置信区间.但但18Probability and Statistics Chapter 6 Parameter Estimation 单侧置单侧置区间区间例如例如, 对对产品设备、电子元件等来说,产品设备、电子元件等来说,我们关心的我们关心的是平均寿命的置信下限,是平均寿命的置信下限, 而在而在讨论产品的废品率时讨论产品的废品率时,我们感兴趣的是其置信上限我们感兴趣的是其置信上限. 本节要引入单侧置信本节要引入单侧置信定义定义设设为为总体分布的未知参数总体分布的未知参数,是取自是取自总体总体的
16、的一个样本,一个样本, 对对给定的数给定的数若若存在统计量存在统计量满足满足区间区间.19Probability and Statistics Chapter 6 Parameter Estimation 单侧置单侧置区间区间满足满足则称则称为为的的置信度为置信度为的的单单侧置信区间侧置信区间,称称为为的的单侧单侧置信下限置信下限; 若存在统计量若存在统计量满足满足则称则称为为的的置信度为置信度为的的单单侧置信区间侧置信区间,称称为为的的单侧单侧置信上限置信上限.20Probability and Statistics Chapter 6 Parameter Estimation 例例3 从一
17、批灯泡中随机地抽取从一批灯泡中随机地抽取5只作寿命试验只作寿命试验, ,命如下命如下(单位单位: h)1050 1100 1120 1250 1280已知这批灯泡寿命已知这批灯泡寿命置信度为置信度为95%的单侧置信下限的单侧置信下限. .解解对于给定的置信度对于给定的置信度有有其寿其寿求求平均寿命平均寿命的的即即21Probability and Statistics Chapter 6 Parameter Estimation 已知这批灯泡寿命已知这批灯泡寿命置信度为置信度为95%的单侧置信下限的单侧置信下限. .解解求求平均寿命平均寿命的的可得可得的的置信度为置信度为的单侧的单侧置信下限为置信下限为由由所得数据计算所得数据计算, , 有有查表得查表得所以所以的的置信度为置信度为95%的置的置信下限为信下限为也就是说也就是说, ,可靠程度为可靠程度为95%. .上上,该批该批灯泡一平均寿命至少在灯泡一平均寿命至少在 1064.56h以以