数学建模概率论4讲义教材

上传人:yuzo****123 文档编号:141365837 上传时间:2020-08-07 格式:PPT 页数:45 大小:761KB
返回 下载 相关 举报
数学建模概率论4讲义教材_第1页
第1页 / 共45页
数学建模概率论4讲义教材_第2页
第2页 / 共45页
数学建模概率论4讲义教材_第3页
第3页 / 共45页
数学建模概率论4讲义教材_第4页
第4页 / 共45页
数学建模概率论4讲义教材_第5页
第5页 / 共45页
点击查看更多>>
资源描述

《数学建模概率论4讲义教材》由会员分享,可在线阅读,更多相关《数学建模概率论4讲义教材(45页珍藏版)》请在金锄头文库上搜索。

1、第六章 参数估计,6.1 点估计的几种方法 6.2 点估计的评价标准 6.3 最小方差无偏估计 6.4 贝叶斯估计 6.5 区间估计,一般常用 表示参数,参数 所有可能取值组成的集合称为参数空间,常用表示。参数估计问题就是根据样本对上述各种未知参数作出估计。 参数估计的形式有两种:点估计与区间估计。,设 x1, x2, xn 是来自总体 X 的一个样本,我们用一个统计量 的取值作为 的估计值, 称为 的点估计(量),简称估计。在这里如何构造统计量 并没有明确的规定,只要它满足一定的合理性即可。这就涉及到两个问题:,其一 是如何给出估计,即估计的方法问题; 其二 是如何对不同的估计进行评价,即估

2、 计的好坏判断标准。,例6.1.1 对某型号的20辆汽车记录其每加仑汽油的行驶里程(km),观测数据如下: 29.8 27.6 28.3 27.9 30.1 28.7 29.9 28.0 27.9 28.7 28.4 27.2 29.5 28.5 28.0 30.0 29.1 29.8 29.6 26.9 经计算有 由此给出总体均值、方差和中位数的估计分别为: 28.695, 0.9185 和 28.6。 矩法估计的实质是用经验分布函数去替换总体分布,其理论基础是格里纹科定理。,二、概率函数P(x,)已知时未知参数的矩法估计,设总体具有已知的概率函数 P(x, 1, , k), x1, x2

3、, , xn 是样本,假定总体的k阶原点矩k存在,若1, , k 能够表示成 1, , k 的函数j = j(1, ,k),则可给出诸j 的矩法估计为 其中,例6.1.2 设总体服从指数分布,由于EX=1/, 即 =1/ EX,故 的矩法估计为 另外,由于Var(X)=1/2,其反函数为 因此,从替换原理来看,的矩法估计也可取为 s 为样本标准差。这说明矩估计可能是不唯一的,这是矩法估计的一个缺点,此时通常应该尽量采用低阶矩给出未知参数的估计。,例6.1.3 x1, x2, , xn是来自(a,b)上的均匀分布U(a,b)的样本,a与b均是未知参数,这里k=2,由于 不难推出 由此即可得到a,

4、 b的矩估计:,6.1.2 极(最)大似然估计,定义6.1.1 设总体的概率函数为P(x; ),是参数 可能取值的参数空间,x1, x2 , , xn 是样本,将样本的联合概率函数看成 的函数,用L( ; x1, x2, , xn) 表示,简记为L( ), 称为样本的似然函数。,如果某统计量 满足 则称 是 的极(最)大似然估计,简记为MLE(Maximum Likelihood Estimate)。,人们通常更习惯于由对数似然函数lnL( )出发寻找 的极大似然估计。 当L( )是可微函数时,求导是求极大似然估计最常用的方法,对lnL( )求导更加简单些。,例6.1.6 设一个试验有三种可能

5、结果,其发生概率分别为 现做了n次试验,观测到三种结果发生的次数分别为 n1 , n2 , n3 (n1+ n2+ n3 = n),则似然函数为 其对数似然函数为,将之关于 求导,并令其为0得到似然方程 解之,得 由于 所以 是极大值点。,极大似然估计有一个简单而有用的性质:如果 是 的极大似然估计,则对任一函数 g( ),其极大似然估计为 。该性质称为极大似然估计的不变性,从而使一些复杂结构的参数的极大似然估计的获得变得容易了。,6.5 区间估计,6.5.1 区间估计的概念,定义6.5.1 设 是总体的一个参数,其参数空间为,x1, x2 , , xn是来自该总体的样本,对给定的一个 (0

6、1),若有两个统计量 和 ,若对任意的 ,有 (6.5.1),则称随机区间 为 的置信水平为1- 的置信区间,或简称 是 的1-置信区间. 和 分别称为 的(双侧)置信下限和置信上限.,这里置信水平1- 的含义是指在大量使用该置信区间时,至少有100(1-)%的区间含有 。,例6.5.1 设x1, x2 , , x10是来自N(, 2)的样本,则 的置信水平为1- 的置信区间为 其中, ,s 分别为样本均值和样本标准差。这个置信区间的由来将在6.5.3节中说明,这里用它来说明置信区间的含义。 若取 =0.10,则t0.95(9)=1.8331,上式化为,现假定 =15, 2 =4,则我们可以用

7、随机模拟方法由N(15,4)产生一个容量为10的样本,如下即是这样一个样本:14.85 13.01 13.50 14.93 16.97 13.80 17.9533 13.37 16.29 12.38 由该样本可以算得 从而得到 的一个区间估计为 该区间包含 的真值-15。现重复这样的方法 100次,可以得到100个样本,也就得到100个区 间,我们将这100个区间画在图6.5.1上。,由图6.5.1可以看出,这100个区间中有91个包含参数真值15,另外9个不包含参数真值。,图6.5.1 的置信水平为0.90的置信区间,取=0.50,我们也可以给出100个这样的区间,见图6.5.2。可以看出,

8、这100个区间中有50个包含参数真值15,另外50个不包含参数真值。,图6.5.2 的置信水平为0.50的置信区间,定义6.5.2 沿用定义6.5.1的记号,如对给定的 (0 1),对任意的,有 (6.5.2) 称 为 的1- 同等置信区间。 同等置信区间是把给定的置信水平1- 用足了。常在总体为连续分布场合下可以实现。,定义 若对给定的 (0 1)和任意的,有 ,则称 为 的置信水平为1- 的(单侧)置信下限。假如等号对一切成立,则称 为 的1- 同等置信下限。若对给定的 (0 1)和任意的,有 ,则称 为 的置信水平为1- 的(单侧)置信上限。若等号对一切成立,则称 为1- 同等置信上限。

9、 单侧置信限是置信区间的特殊情形。因此,寻求置信区间的方法可以用来寻找单侧置信限。,6.5.3 单个正态总体参数的置信区间,一、 已知时 的置信区间 由此给出了的同等置信区间为 , 。 (6.5.8) 这是一个以 为中心,半径为 的对称 区间,常将之表示为 。,例6.5.3 用天平秤某物体的重量9次,得平均值为 (克),已知天平秤量结果为正态分布,其标准差为0.1克。试求该物体重量的0.95置信区间。 解:此处1- =0.95, =0.05,查表知u0.975=1.96,于是该物体重量 的0.95置信区间为 , 从而该物体重量的0.95置信区间为 15.3347,15.4653。,例6.5.4

10、 设总体为正态分布N(,1),为得到 的置信水平为0.95的置信区间长度不超过1.2,样本容量应为多大? 解:由题设条件知 的0.95置信区间为 其区间长度为 ,它仅依赖于样本容量n而与样本具体取值无关。现要求 ,立即有n(2/1.2)2u21-/2.现1- = 0.95,故u1-/2=1.96,从而n(5/3)2 1.962 = 10.6711。即样本容量至少为11时才能使得 的置信水平为0.95的置信区间长度不超过1.2。,二、 2未知时 的置信区间, 的1-置信区间为 此处 是 2的无偏估计。,例6.5.5 假设轮胎的寿命服从正态分布。为估计某种轮胎的平均寿命,现随机地抽12只轮胎试用,

11、测得它们的寿命(单位:万公里)如下: 4.68 4.85 4.32 4.85 4.61 5.02 5.20 4.60 4.58 4.72 4.38 4.70 此处正态总体标准差未知,可使用t分布求均值的置信区间。经计算有 =4.7092,s2=0.0615。取 =0.05,查表知t0.975(11)=2.2010,于是平均寿命的0.95置信区间为(单位:万公里),在实际问题中,由于轮胎的寿命越长越好,因此可以只求平均寿命的置信下限,也即构造单边的置信下限。由于 由不等式变形可知 的1-置信下限为 将t0.95(11)=1.7959代入计算可得平均寿命 的0.95置信下限为4.5806(万公里)

12、。,三、 2的置信区间, 2的1-置信区间为,例6.5.6 某厂生产的零件重量服从正态分布N(, 2),现从该厂生产的零件中抽取9个,测得其重量为(单位:克) 45.3 45.4 45.1 45.3 45.5 45.7 45.4 45.3 45.6 试求总体标准差 的0.95置信区间。 解:由数据可算得 s2 =0.0325,(n-1)s2=80325=0.26. 查表知 2 0.025(8) =2.1797,20.975(8)=17.5345, 代入可得 2的0.95置信区间为 从而 的0.95置信区间为: 0.1218,0.3454。,在样本容量充分大时,可以用渐近分布来构造近似的置信区间

13、。一个典型的例子是关于比例p 的置信区间。,6.5.4 大样本置信区间,设x1, xn是来自b(1, p)的样本, 得到p的置信区间为 其中记= u21-/2,实用中通常略去/n项,于是可将置信区间近似为,例6.5.7 对某事件A作120次观察,A发生36次。试给出事件A发生概率p 的0.95置信区间。 解:此处n=120, =36/120=0.3 而u0.975=1.96,于是p的0.95(双侧)置信下限和上限分别为 故所求的置信区间为 0.218,0.382,例6.5.8 某传媒公司欲调查电视台某综艺节目收视率p,为使得 p 的1-置信区间长度不超过d0,问应调查多少用户?,解:这是关于二

14、点分布比例p的置信区间问题,由(6.5.11)知,1-的置信区间长度为 这是一个随机变量,但由于 ,所以对任意的观测值有 。这也就是说p的1-的置信区间长度不会超过 。现要求p的的置信区间长度不超过d0,只需要 即可,从而 (6.5.12),这是一类常见的寻求样本量的问题。比如,若取d0=0.04, =0.05,则 。 这表明,要使综艺节目收视率p的0.95置信区间的长度不超过0.04,则需要对2401个用户作调查。,6.5.5 两个正态总体下的置信区间,设x1 , , xm是来自N(1, 12)的样本,y1 , , yn是来自N(2, 22)的样本,且两个样本相互独立。 与 分别是它们的样本

15、均值, 和 分别是它们的样本方差。下面讨论两个均值差和两个方差比的置信区间。,一、1 -2的置信区间,1、 12和 22已知时的两样本u区间 2、 12 = 22 = 2未知时的两样本t区间,3、 22 / 12=已知时的两样本t区间,4、当m和n都很大时的近似置信区间 5、一般情况下的近似置信区间 其中,例6.5.9 为比较两个小麦品种的产量,选择18块条件相似的试验田,采用相同的耕作方法作试验,结果播种甲品种的8块试验田的亩产量和播种乙品种的10块试验田的亩产量(单位:千克/亩)分别为: 甲品种 628 583 510 554 612 523 530 615 乙品种 535 433 398 470 567 480 498 560 503 426 假定亩产量均服从正态分布,试求这两个品种平均亩产量差的置信区间.( =0.05)。,解:以x1 , , x8记甲品种的亩产量,y1 , , y10记乙品种的亩产量,由样本数据可计算得到 =569.3750,sx2 =2140.5536,m=8 =487.0000,sy2=3256.2222, n=10 下面分两种情况讨论。,(1) 若已知两个品种亩产量的标准差相同,则可采用两样本t区间。此处 故1 -2的0.95置信区间为,(2) 若两个品种亩产量的方差不等,则可采

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号