第三章 参数估计与假设检验主要内容:l 过程参数的估计l假设检验的基本思想l 均值检验l总体方差检验 知识点及其基本要求¨掌握参数的点估计和区间估计方法¨了解点估计的评价标准¨区分方差已知和方差未知时的估计方法差异¨掌握均值检验的方法¨理解假设检验的基本思想¨掌握总体方差检验的方法¨区分方差已知和方差未知时的检验方法重点:Ø过程参数估计Ø均值检验难点:Ø总体方差检验 点估计 参数估计 区间估计统计推断 假设检验:均值间的比较 标准偏差的比较 构成比率的比较 ……第一节 过程参数估计参数估计:从样本除非取构造某些适当的统计量来对总体的某些未知参数进行估计。
分为点估计和区间估计 一、参数的点估计 当总体的分布形式已知,但有一个或多个参数未知时,如果通过随机抽样得到x的一个样本观察值(x1, x2 ,…xn),利用这组数据算得估计量的特点值,以此作为未知参数的估计值 常用的点估计方法:矩估计和极大似然估计 点估计的期望值等于被估计的总体参数无偏性是对估计量的一个重要的、最常见的要求,其实际意义就是无系统误差1、评价点估计的优劣标准 根据不同的要求,评价点估计的标准主要有: 无偏性、有效性、一致性、充分性1)无偏性 定义:如果估计量满足,则证明:例1:设X1,X2,……,Xn为总体的样本,证明样本平均值 及样本方差s2分别是总体均值μ和总体方差σ2的无偏估计(2)有效性 定义3.2: 设 和 都是θ的无偏估计,若样本量为n, 的方差小于 的方差,则称 是比 有效的估计量如果在θ的一切无偏估计量中, 的方差达到最小,则称 为θ的有效估计量 要比较同一参数的两个无偏估计量的优劣,其标准自然应该是在样本量相同时,看哪一个估计量的取值较大地集中在参数θ的附近。
即要求 的方差越小越好有效估计量就是具有最小方差的无偏估计量 例2:设X1,X2,…,Xn为总体X的样本,比较总体均值μ的两个估计量的有效性解: 当样本量时n=1, ;而当n>1时,显然有 ,故 比 更有效例3:设总体X的期望E(X)和方差D(X)都存在,X1、X2是来自X的样本,下列估计中哪个较好,哪个较差(3)一致性定义3.3: 如果当 时, 依概率收敛于θ,即任给 , ,则称 为参数θ的一致估计 即:任给ε>02. 点估计的计算方法 矩法估计是求点估计最古老的方法,就是用样本的数字特征来估计与之相应的总体数字特征常用的是用样本平均值 来估计总体的平均值μ;用样本的方差s2来估计总体的方差σ2 (1)矩法估计Ø样本的k阶原点矩为:Ø总体的k阶原点矩为:Ø样本的k阶中心矩为:Ø总体的k阶中心矩为:其中k为正整数。
1) 矩估计法例例4 4::已知晶体管寿命服从正态分布,现从中随机抽取一个样本,测得的数据为1322,1324,1321,1325,1320,1326求总体参数μ和σ2的矩估计 解解:样本观测值代入上述公式中,得相应的估计值为: 例5: 某工厂生产了一批轴承,为了解该批轴承的长度,从中抽取10件进行测量,得出如下数据(单位:mm): ,,,,, ,,,,501.4问:该天生产的轴承的平均长度以及长度的方差大约是多少? 解: 因此,可将和作为该批轴承的平均长度和长度方差的估计值设(X1, X2 ,…Xn)是来自密度为 的总体的一个简单随机样本,则( X1, X2 ,…Xn )的联合密度函数为 将样本观测值x1,x2,…,xn 视为常数,待估参数θ 视为变量,则这个联合密度函数是θ的似然函数,反映了样本和总体参数之间的关系2) 极大似然估计法 定义3.4 : 设总体的分布形式为已知, 为X的一组样本观测值,如果 处达到最大值,则称 的最大似然估计。
最大似然估计就是将似然函数L的最大值点 作为θ的估计值 解方程式 可得最大似然估计 和上述方程组的解就是参数的最大似然估计量 可直接通过似然方程求得 如果 由于L和lnL同时达到最大值,故只需求lnL的最大值点即可所以, 可直接通过似然方程 求得 ,则通过求下列似然方程组: 如果θ是一个向量,即 ,则通过求下列似然方程组:方程组的解就是参数的最大似然估计量例例6 6:设(x1, x2 ,…,xn)是正态分布 的一个样本,求总体参数μ和σ2的极大似然估计 解:则得令已知为X的一组样本观测值,求参数λ的最大似然估计量例7:设总体服从指数分布解: 似然函数为 令得得λ的最大似然估计值为二、参数的区间估计二、参数的区间估计 1、区间估计的概念设θ是总体X的一个未知参数,从该总体中抽取样本,参数的区间估计是要找两个统计量 ,对于给定的α(1< α<1),满足则( , )叫做θ的置信度为1-α的置信区间。
对于给定的显著性水平α, 若由样本观测值x1,x2, …xn 确定的统计量 ( x1,x2, …,xn)满足:则称置信区间[ ,∞ ]为θ的置信度为1-α的单侧置信区间, 是单侧置信下限单侧置信下限满足 ,称 为单侧置信上限单侧置信上限:1.方差已知情况的正态分布均值的置信区间 设X为正态随机变量,其均值μ未知,方差σ2已知, 假定(x1, x2 ,…,xn)是总体取得的随机样本,其均值为 ,则总体均值μ的1-α的双侧置信区间为:区间估计的一般步骤如下: 1.明确待估参数和置信水平; 2.用参数的点估计法导出估计量的分布; 3.利用估计量的分布给出置信区间式中: 为标准正态分布的α/2 分位点μ的100(1-α)%的上单侧置信区间为 μ的100(1-α)%的下单侧置信区间为例8:设从正态总体 随机抽得一个样本(x1, x2 ,…,xn),其均值为 ,试求总体均值μ的95%置信区间。
解:由正态分布表可查得故 即μ的95%置信区间为,15.244] 2.方差未知情况的正态分布均值的置信区间设X为正态随机变量,其均值μ和方差σ2未知假定(X1, X2 ,…,Xn)是总体取得的一个有n个观察值的随机样本,其均值为 ,样本方差为 ,则μ的置信度为1-α的双侧置信区间为式中,是自由度为n-1的t分布,其使得 的分位点其相应的上、下μ的1-α的单侧置信区间为 例例9 9:从一批螺钉中随机抽取9枚,测得其长度为已知螺钉长度服从正态分布 ,试求总体均值μ的90%置信区间解:从样本数据计算有由t分布表查得 即μ的90%置信区间为,2.141] 第二节 假设检验的基本思想一、假设检验的概念¨统计推断的一类重要问题是根据样本的信息来判断总体分布是否具有指定的特征如:¨已知样本来自正态总体,问是否有理由认为它是来自均值为μ0的正态总体?¨这类根据理论或实验得来的模型,常常做成一个统计假设,用另一个实验对个假设进行检验,以绝对该假设是否正确¨验证或判定给定统计假设的方法称为假设检验¨假设检验就是对总体情况的某一命题,从样本去推断假设是否成立¨确定在假设中所规定的参数值。
(1)根据以往的经验或数据来确定 (2)根据理论或过程模型来确定 (3)根据合同规定或设计技术规格来确定 二、假设检验的作用¨ 样本均值与总体均值不等或两样本均值不等,有两种可能: ①由抽样误差所致; ②两者来自不同的总体¨假设检验假设检验是用来推断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法 三、假设检验基本思想 根据小概率原理的基本思想,也就是对总体的某个假设是真实的,那么不支持这一假设的事件A是一个小概率事件,在一次试验中几乎不可能发生,如果事件A发生,就有理由怀疑这一假设的真实性,因而拒绝这一假设 假设检验亦称显著性检验,就是对所估计的总体先提出一个假设,再通过样本数据去推断是否拒绝这一假设 三、单、双侧检验三、单、双侧检验接受域与拒绝域接受域与拒绝域拒绝域:检验量的绝对值落在大于等于临界值以外的区域接受域:检验量的绝对值落在小于临界值以外的区域四、假设检验中的两类错误在假设检验中,两类错误:¨ H0为真而被拒绝的错误¨ H0不为真而被接受的错误 通常,这两类错误记为¨ α=P{第一类错误}=P{拒绝H0|H0为真}¨ β=P{第二类错误}=P{接受H0|H0不为真}α:生产方的风险,其表示为一个良好批被拒绝的概率;β:使用方的风险,其表示为一个不良批被接受的概率。
β是样本大小的函数,样本越大,β风险就越小五、 假设检验的基本步骤¨例10:消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌包装上标明的容量为250毫升消费者协会从市场上随机抽取50盒该品牌纸包装饮品,测试发现平均含量为248毫升,小于250毫升这是生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢?第一步:建立假设、确定检验水准第一步:建立假设、确定检验水准 p确定是单侧还是双侧检验 ;p建立检验假设H0:即认为差异仅由抽样误差引起;p建立备择假设H1:存在本质差异H0 与H1 相关且对立,二者都是对总体特征总体特征的假设 五、 假设检验的基本步骤p确定检验水准 : 显著性水准•判断应当拒绝或不拒绝H0 的水准,即小概率事件的标准;•常取或 本例:H0:H1:单侧p根据资料的类类型型和和研研究究目目的的,选择合适的统计检验方法,计算相应的统计量值 例如:本例选用t 检验,则计算t 值,若u 检验则计算u 值第二步:选定统计方法,计算第二步:选定统计方法,计算统计量统计量第三步:确定P值、作出推断结论(包括统计结论和专业结论)¨ 根据统统计计量量的的大大小小及及其其分分布布确定检验假设成立的可能性P P 的大小的大小。
•P P 值值含含义义:在由H0 所规定的总体中做随机抽样时,获得等等于于及及大大于于((或或等等于于及及小小于于))现有样本获得的统计量值样本获得的统计量值的概率概率第三节 均值检验 在应用上,常常根据样本检验总体参数是否等于某一常数,或者大于某一常数或小于某一常数. 另外也可根据来自不同总体的两个或更多个独立样本,检验相应的两个或更多个总体参数之间是否存在着显著差异 这些都是属于总体均值检验的问题(一)总体方差已知 设总体 ,其中σ 已知, 是来自总体 的样本,现在要对总体均值μ 进行检验对这种一个正态总体且方差已知的情况,又可分成三种类型的假设检验:具体地,假设检验的步骤如下:(1)确定待检验的命题,提出假设,包括原假设H0和备择假设H1; 例如,假定螺钉的平均长度为,则此命题可如下表示或更一般地有:原假设备择假设(2)选择检验H0的统计量,并确定相应统计量的分布;(3)选择显著性水平(或称检验水平)α,查表确定临界值 ,使 根据样本观测值计算统计量 的值并与临界值 比较;(4)判断H0是否成立当统计量落入接收域,即 ,接受H0,反之, 拒绝H0。
当 时,否定假设H0; 当 时,接受假设H0 属于单侧检验问题 当 时,否定假设H0; 当 时,接受假设H0 也属于单侧检验问题 ¨在例10中,按历史资料,总体的标准差是4毫升我们通过检验总体均值是否等于250毫升,来判断饮料厂商是否欺骗了消费者¨程序如下: 以上的备择假设是总体均值小于250毫升,因为消费者协会希望通过样本数据推断出厂商的欺骗行为(大于250毫升一般不会发生)因此使用左侧检验第一步:确定原假设与备择假设第二步:构造出检验统计量¨我们知道,如果总体的标准差已知,则正态总体(正常情况下,生产饮料的容量服从正态分布)的抽样平均值,也服从正态分布,对它进行标准化变换,可得到:¨ ¨可用z作为检验统计量 ¨通常显著水平由实际问题确定,我们这里取,左单侧检验,拒绝域安排在左边,查标准正态分布表得临界值: ,拒绝域是u。
第三步:确定显著性水平,确定拒绝域¨样本平均值 ,n=50,代入检验统计量得: 第四步:计算检验统计量的数值第五步:判断 检验统计量的样本取值落入拒绝域拒绝原假设,接受备择假设,认为有足够的证据说明该种纸包饮料的平均容量小于包装盒上注明的250毫升,厂商有欺诈之嫌 例例11:某种零件的尺寸服从正态分布,方差为1.21.今从一批零件中抽取6件,测得尺寸数据(mm)为:取检验水平,能否认为此批零件均值为32.50mm?解:1.检验假设2.选择统计量 3.选择显著性水平α 由于U0~N(0,1),且 故检验的拒绝哉域为(-∞,)和(1.96,∞) (一)总体方差已知4. 判断H0是否成立由样本观察值得 由于落在()之外,故不能判断H0成立,即不能认为此批零件尺寸的均值为 在实际工作中,当 时,说明在检验水平上试验结果和假设无矛盾一般地,经过一次检验没有被否定的假设不一定是正确的假设,这时要增加样本量再作检验但当 或实际工作需要迅速做出决定时,可以考虑接受原假设 (一)总体方差未知 设总体 ,其中σ 未知, 是来自总体 的样本,现在要对总体均值μ 进行检验。
对这种一个正态总体且方差未知的情况,又可分成三种类型的假设检验:(二)方差未知1. 检验假设由于方差未知,故选统计量 当 时, ,对于给定的检验水平α ,查t分布表对应的自由度为n-1 的临界值 , 计算统计量 的t值:例例12:装有化学药品的瓶子,其规范要求是30cc,从稳态生产中采集样本量n=25的样本,其均值 ,样本标准差 , 取检验水平 , 能否认为该批量产品的均值是30cc 解:1.检验假设 2.检验统计量 3.在显著性水平水平下 则检验的拒绝域为(-∞,)和(2.064,∞)4.由样本观察值得落在()间,所以接收H0假设可以认为该批量产品的均值是30cc. 二、两个正态总体的均值检验¨总体方差已知¨总体方差未知二、两个正态总体的均值检验¨设有两个总体 , ,且X和Y相互独立,其中 对于两个正态总体均值的检验问题,当总体方程已知时,由于则: 因此,在假设成立的条件下,即 时,可选取统计量 在假设H0成立的条件下,即 时,U服从标准正态分布。
根据给定的检验水平α,查正态分布表确定临界值uα/2,对给定的样本,计算出统计量的值u,若 ,则否定假设;若 ,则接受假设当 时,拒绝假设;当 时,则接受假设 ¨若 ,拒绝假设;¨若 ,则接受假设第四节 总体方差检验¨一、一个正态总体的方差检验¨二、二个正态总体的方差检验一、一个正态总体的方差检验选取统计量 在假设成立的条件下,即样本来自总体 时,统计量服从自由度为的 分布对于给定的检验水平α,可以查 分布表确定临界值 和 ,满足 对于给定样本计算出统计量的值,当 或 时,否定假设;当 时,接受假设。
对于给定样本计算出统计量的值,当 时,否定假设;当 时,接受假设对于给定样本计算出统计量的值,当 时,否定假设;当 时,接受假设二、两个正态总体的方差检验对两个正态总体有如下关系:因此选取统计量在假设H0成立的条件下,由于 ,则统计量服从第一自由度为n1-1,第二自由度为n2-1的F分布,对于给定的检验水平α,查分布表得到临界值 和 ,满足当 或 时,否定假设,当 时,接受假设对给定的样本,计算出统计量的值,2.检验假设:3.检验假设:u若 ,则接受假设u若 ,则接受假设。
u若 ,则拒绝假设;u若 ,则拒绝假设;例例1313:从稳定的生产过程中取出n=25的样本,设备甲的方差为100设备乙的方差是50,其样本量为10设备甲的制造商认为上述结果是“统计意外”假设“统计意外”意味着100次机会中发生的可能性小于1次,即对上述两个方差实际上相等的假设进行检验 解:检验假设 选择统计量 在显著性水平α=0.01 时 检验的拒绝域为(4.73,∞) 由样本观察值得 故不能拒绝H0可以得出结论,结果是一个统计意外本章小结¨参数估计:无偏性、有效性 点估计的期望值等于被估计的总体参数无偏性是对估计量的一个重要的、最常见的要求,其实际意义就是无系统误差 如果估计量满足,则 设 和 都是θ的无偏估计,若样本量为n, 的方差小于 的方差,则称 是比 有效的估计量如果在θ的一切无偏估计量中, 的方差达到最小,则称 为θ的有效估计量。
本章小结¨点估计:矩法Ø样本的k阶原点矩为:Ø总体的k阶原点矩为:Ø样本的k阶中心矩为:Ø总体的k阶中心矩为:其中k为正整数点估计:极大似然估计法本章小结解方程式 可得最大似然估计 本章小结区间估计的一般步骤如下:¨ 1.明确待估参数和置信水平;¨ 2.用参数的点估计法导出估计量的分布;¨ 3.利用估计量的分布给出置信区间2.方差已知情况的正态分布均值的置信区间双侧:上单侧:下单侧:本章小结2.方差未知情况的正态分布均值的置信区间双侧:上单侧:下单侧:本章小结假设检验基于小概率原理思想,其步骤如下:(1)确定待检验的命题,提出假设,包括原假设H0和备择假设H1; 例如,假定螺钉的平均长度为,则此命题可如下表示原假设备择假设本章小结α:生产方的风险,其表示为一个良好批被拒绝的概率;β:使用方的风险,其表示为一个不良批被接受的概率 β是样本大小的函数,样本越大,β风险就越小2)选择检验H0的统计量,并确定相应统计量的分布;(3)选择显著性水平(或称检验水平)α,根据统计量分布及α值确定拒绝域;(4)判断H0是否成立。
当统计量落入接收域则不能拒绝H0,反之拒绝H0 在假设检验中,两类错误: H0为真而被拒绝的错误,α H0不为真而被接受的错误, β本章小结¨一个正态总体均值检验 :方差σ2已知 ,方差σ2未知 本章小结两个正态总体的均值检验,方差 、 已知本章小结两个正态总体的均值检验,方差 、 未知,但本章小结¨一个正态总体方差检验本章小结¨两个正态总体方差检验本章小结。