数理统计 第三节 区间估计置信区间定义置信区间的求法单侧置信区间课堂练习课堂练习小结 布置作业数理统计 引言前面,我们讨论了参数点估计. 它是用样本算得的一个值去估计未知参数. 但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似 值的误差范围,使用起来把握不大. 区间估计正好弥补了点估计的这个缺陷 .数理统计 譬如,在估计湖中鱼数的问题中,若我们 根据一个实际样本,得到鱼数 N 的极大似然估 计为1000条.若我们能给出一个区间,在此区间内我们 合理地相信 N 的真值位于其中. 这样对鱼数的 估计就有把握多了.实际上,N的真值可能大于1000条,也可 能小于1000条.数理统计 也就是说,我们希望确定一个区间,使我们能 以比较高的可靠程度相信它包含真参数值.湖中鱼数的真值[ ]这里所说的“可靠程度”是用概率来度量的 , 称为置信度或置信水平.习惯上把置信水平记作 ,这里 是一个很小的正数.数理统计 置信水平的大小是根据实际需要选定的.置信区间.称区间 为 的置信水平为 的例如,通常可取置信水平 =0.95或0.9等.根据一个实际样本,由给定的置信水平,我小的区间 ,使们求出一个尽可能数理统计 一、 置信区间定义满足设 是 一个待估参数,给定X1,X2,…Xn确定的两个统计量则称区间 是 的置信水平(置信度 )为 的置信区间.和 分别称为置信下限和置信上限. 若由样本数理统计 这里有两个要求:可见,对参数 作区间估计,就是要设法找出两个只依赖于样本的界限(构造统计量).一旦有了样本,就把 估计在区间 内 .数理统计 可靠度与精度是一对矛盾,一般是 在保证可靠度的条件下尽可能提高 精度.1. 要求 以很大的可能被包含在区间内,就是说,概率 要尽可能大 .即要求估计尽量可靠. 2. 估计的精度要尽可能的高. 如要求区间长度尽可能短,或能体现该要求的其它准则.数理统计 在求置信区间时,要查表求分位点.二、置信区间的求法设 , 对随机变量X,称满足的点 为X的概率分布的上 分位点. 定义数理统计 若 X 为连续型随机变量 , 则有所求置信区间为所求置信区间为数理统计 标准正态分布的 上 分位点数理统计 分布的上 分位数自由度为n的数理统计 F分布的上 分位数自由度为n1,n2的数理统计 ~ N(0, 1)选 的点估计为 ,求参数 的置信度为 的置信区间. 例1 设X1,…Xn是取自 的样本, 明确问题,是求什么 参数的置信区间? 置信水平是多少?寻找未知参 数的一个良 好估计.解寻找一个待估参数和 统计量的函数 ,要求 其分布为已知.有了分布,就可以求出 U取值于任意区间的概率.数理统计 对给定的置信水平查正态分布表得对于给定的置信水平, 根据U的分布,确定一 个区间, 使得U取值于该区间的概率为置信水平.使为什么 这样取?数理统计 从中解得对给定的置信水平查正态分布表得使数理统计 也可简记为于是所求 的 置信区间为数理统计 从例1解题的过程,我们归纳出求置信区间的一般步骤如下:1. 明确问题, 是求什么参数的置信区间?置信水平 是多少?2. 寻找参数 的一个良好的点估计T(X1,X2,…Xn)3. 寻找一个待估参数 和估计量 T 的函数 U(T, ),且其分布为已知. 数理统计 4. 对于给定的置信水平 ,根据U(T, ) 的分布,确定常数a, b,使得 P(a