概率论与数理统计：第六章样本及抽样分布 (2)

资源描述

《概率论与数理统计：第六章样本及抽样分布 (2)》由会员分享，可在线阅读，更多相关《概率论与数理统计：第六章样本及抽样分布 (2)（137页珍藏版）》请在金锄头文库上搜索。

1、目目录录随机样本随机样本抽样分布抽样分布b 点估计点估计估计量的评选标准估计量的评选标准Y 区间估计区间估计B 正态总体均值与方差的区间估计正态总体均值与方差的区间估计O (0-1)(0-1)分布参数的区间估计分布参数的区间估计B 单侧置信区间单侧置信区间p 假设检验假设检验l 正态总体均值的假设检验正态总体均值的假设检验Z 正态总体方差的假设检验正态总体方差的假设检验分布的拟合检验分布的拟合检验秩和检验秩和检验第六章第六章样本及抽样分布样本及抽样分布数理统计的内容：如何收集、整理带有随机数理统计的内容：如何收集、整理带有随机性的数据资料；如何对所得的数据资料进行分性的数据资料

2、；如何对所得的数据资料进行分析、研究，从而对所研究的对象的性质、特点析、研究，从而对所研究的对象的性质、特点作出推断。作出推断。1. 随机样本随机样本一一.定义定义:在统计学中在统计学中, 我们将试验的全部可能的观察值称我们将试验的全部可能的观察值称为为总体总体（这些值可能是相同的），每一个可能观察值称为（这些值可能是相同的），每一个可能观察值称为个体个体，总体中所包含的个体的个数称为总体的容量。，总体中所包含的个体的个数称为总体的容量。(可分为有限总体和无限总体可分为有限总体和无限总体) 一个总体对应于一个随机变量。一个总体对应于一个随机变量。二二. 定义定义:设设X是具有分布函数是具有分布

3、函数F的的r.v.,若若X1, X2,Xn是具是具有同一分布函数有同一分布函数F的相互独立的的相互独立的r.v.,则称为则称为从分布函数从分布函数F(或总体或总体F、或总体、或总体X)得到的容量为得到的容量为n的简单随机样本的简单随机样本, 简简称称样本样本, 它们的观察值它们的观察值x1,x2, , xn称为称为样本值样本值, 又称为又称为X的的n个独立的观察值个独立的观察值.2. 抽样分布抽样分布一一.定义定义: 设设X1, X2, , Xn是来自总体是来自总体X的一个样本的一个样本, 又设又设g(X1, X2, , Xn)是一个连续函数是一个连续函数, 如果如果g中不含中不含有未知参数

4、有未知参数, 则称则称g(X1, X2, , Xn)为为统计量统计量. 由定义可知由定义可知, 统计量也是一个随机变量统计量也是一个随机变量,如如果果x1, x2, , xn是一组样本值是一组样本值, 则则g(x1, x2, , xn)是统计量是统计量g(X1, X2, , Xn)的一个观察值的一个观察值.二二. 常用的统计量常用的统计量:说明说明证明：证明：三三. 几种常用的统计分布几种常用的统计分布: 统计量是样本的函数统计量是样本的函数, 它是一个随机它是一个随机变量变量. 统计量的分布称为统计量的分布称为抽样分布抽样分布.0yf(y)其值由附表其值由附表4给出给出.(二二) t-分布

5、分布:h(t)02.t分布的上侧分位点由附表分布的上侧分位点由附表3给出给出.当当n45时时,有有(三三) F分布分布:y0(四四) 正态总体样本的均值与样本方差的分布正态总体样本的均值与样本方差的分布:第六章第六章习题课习题课总体总体样本样本统计量统计量抽样分布抽样分布正态总体样本均值与样本方差的分布正态总体样本均值与样本方差的分布参数估计的一般提法：参数估计的一般提法：设有一个统计总体，总体的分布函数设有一个统计总体，总体的分布函数第七章第七章参数估计参数估计 1. 1. 点估计点估计一一. . 问题的提法问题的提法: :二二. 矩估计法矩估计法:1.之所以可用样本矩作为相应

6、的总体矩的之所以可用样本矩作为相应的总体矩的估计量估计量, 用样本矩的连续函数作为相应的用样本矩的连续函数作为相应的总体矩的连续函数的估计量总体矩的连续函数的估计量, 其原因在于其原因在于样本矩样本矩Ak依概率收敛于相应的总体矩依概率收敛于相应的总体矩, 而而样本矩的连续函数依概率收敛于相应的总样本矩的连续函数依概率收敛于相应的总体矩的连续函数体矩的连续函数.三三. 最大似然估计方法最大似然估计方法:最大似然估计的求解方法最大似然估计的求解方法:例例2. 设设X服从服从a, b区间上的均匀分布区间上的均匀分布, 求求a和和 b的的最最大似然大似然估计和矩估计量估计和矩估计量.2.矩估计：矩估计

7、：最大似然估计量和矩估计量不一定相同最大似然估计量和矩估计量不一定相同, 但正态但正态分布的是相同的分布的是相同的, 例如例如(P163例例5)最大似然估计的性质最大似然估计的性质:2. 2. 估计量的评选标准估计量的评选标准 10 无偏性无偏性:(3)例子例子2. S2是是D(X)的无偏估计量的无偏估计量:20有效性有效性:30一致性一致性:3. 3. 区间估计区间估计一一. 问题引入问题引入:二二. 定义定义: 10. (4.71, 5.69)已不是一个随机区间已不是一个随机区间, 但仍称但仍称它为置信度为它为置信度为0.95的置信区间的置信区间, 其其直观含义直观含义: 若反复抽样

8、多次若反复抽样多次, 每个样本值每个样本值(n=16)均确定均确定一个区间一个区间, 在这么多的区间中在这么多的区间中, 包含包含的约占的约占 95%, 不包含不包含的约占的约占5%,现抽样得到的区间现抽样得到的区间(4.71, 5.69), 则该区间属于那些包含则该区间属于那些包含的区间的可信度为的区间的可信度为 95%, 或或“该区间包含该区间包含 ”这一这一事实的可信度事实的可信度为为95%.三三. 求置信区间的一般思路求置信区间的一般思路:1. 设法构造一个随机变量设法构造一个随机变量Z=Z(X1, X2, , Xn; ),除参数除参数外外, Z不包含其他任何未知参数不包含

9、其他任何未知参数, Z的分布的分布已知已知(或可求或可求出出),并且不依赖于参数并且不依赖于参数 , 也不依赖于也不依赖于其他任何未知参其他任何未知参数数.4.4.正态总体均值与方差的区间估计正态总体均值与方差的区间估计一一. 单个正态总体的均值与方差的区间估计单个正态总体的均值与方差的区间估计:三三. 两个正态总体的区间估计两个正态总体的区间估计:四四. 两个总体方差比的置信区间两个总体方差比的置信区间:5. (0-1)分布参数的区间估计分布参数的区间估计例例设自一大批产品的设自一大批产品的100个样品中个样品中, 得一级品得一级品60个个, 求这求这批产品的一级品率批产品的一级品

10、率p的置信度为的置信度为0.95的置信区间的置信区间.6. 单侧置信区间单侧置信区间一一. 定义定义:二二.求正态总体的均值的单侧置信下限和求正态总体的均值的单侧置信下限和方差的单侧置信上限方差的单侧置信上限:第七章第七章习题课习题课参数的点估计参数的点估计矩估计法矩估计法最大似然最大似然估计法估计法参数的区间估计参数的区间估计正态总体参正态总体参数的区间估计数的区间估计5.5.设总体设总体X X的概率密度为的概率密度为第八章第八章假设检验假设检验1. 假设检验假设检验一一. 基本思想基本思想:例例1. 某车间用一台包装机包装葡萄糖某车间用一台包装机包装葡萄糖,包得的袋装糖重

11、是包得的袋装糖重是一个随机变量一个随机变量, 它服从正态分布它服从正态分布. 当机器正常时当机器正常时,其均值为其均值为0.5公斤公斤,标准差为标准差为0.015公斤公斤.某日开工后为检验包装机是某日开工后为检验包装机是否正常否正常,随机地抽取它所包装的随机地抽取它所包装的9袋袋,称得净重为称得净重为(公斤公斤) 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512问机器是否正常问机器是否正常? 假设检验所采用的方法是一种反正法假设检验所采用的方法是一种反正法: 先假设结论成立先假设结论成立, 然后在这个结论成立然后在这个结论成立的条件下

12、进行推导和运算的条件下进行推导和运算, 如果得到矛如果得到矛盾盾, 则推翻原来的假设则推翻原来的假设, 结论不成立结论不成立, 这这里的矛盾是与实际推断原理的矛盾里的矛盾是与实际推断原理的矛盾,即即如果如果“小概率事件在一次试验中发生了小概率事件在一次试验中发生了”, 则认为原假设不成立则认为原假设不成立, 因此因此, 假设检验假设检验是一种带有概率性质的反证法是一种带有概率性质的反证法.二二. 基本概念与术语基本概念与术语:1. 称给定的称给定的 (0 1)为为显著性水平显著性水平.5. 假设检验的一般步骤假设检验的一般步骤：三三. 假设检验的两类错误假设检验的两类错误:1. 第一类

13、错误第一类错误: 如果原假设如果原假设H0成立成立,而观察值落入拒绝域而观察值落入拒绝域,从而作从而作出拒绝出拒绝H0的结论的结论,称作第一类错误称作第一类错误,又称又称“弃真弃真”的的错误错误.由定义知由定义知, 显著性水平显著性水平恰好是犯第一类错恰好是犯第一类错误的概率误的概率.2. 第二类错误第二类错误: 如果原假设如果原假设H0不成立不成立, 而观察值未落入拒绝域而观察值未落入拒绝域,从从而作出接受而作出接受H0的结论的结论,称作第二类错误称作第二类错误, 又称又称“取取伪伪”的错误的错误,通常记作通常记作 .接受域接受域在确定检验法则时在确定检验法则时,我们应尽可能使犯

14、两类错我们应尽可能使犯两类错误的概率都较小误的概率都较小. 但是但是, 当容量当容量n一定时一定时, 变变小小, 变大变大;相反地相反地, 变大变大, 变小变小. 不能同时使不能同时使两者都很小两者都很小, 要使要使 , 同时很小时同时很小时, 则必须增则必须增加样本容量加样本容量. 在实际使用时在实际使用时, 通常人们只控制通常人们只控制第一类错误第一类错误,而不考虑犯第二类错误而不考虑犯第二类错误, 这种检这种检验问题验问题,称为显著性检验问题称为显著性检验问题.四四. 双边假设检验和单边假设检验双边假设检验和单边假设检验:2 正态总体均值的假设检验正态总体均值的假设检验一一. 已知已知

15、2, 检验检验 :二二. 未知未知 2, 检验检验 :例例1. 某种电子产品的寿命某种电子产品的寿命x(以小时记以小时记)服从正态分服从正态分布布, , 2均未知均未知, 现测得现测得16只元件的寿命如下只元件的寿命如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 问：是否有理由认为元件的平均寿命大于问：是否有理由认为元件的平均寿命大于225小时小时?三三. 两个正态总体均值差的检验两个正态总体均值差的检验(t-检验检验):1. 对于单侧检验对于单侧检验“H0: 1 2+ ”和和 “H0: 1 2+ ”, 可

16、以类似地推出可以类似地推出. 常用的是常用的是 =0.2. 对于对于 12, 22已知时已知时, 可用可用“u- 检验检验方法方法”检验检验.例例2. 在平炉上进行一项试验以确定改变操作方法的建议在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率是否会增加钢的得率, 试验是在同一只平炉上进行的试验是在同一只平炉上进行的. 每每炼一炉钢时除操作方法外炼一炉钢时除操作方法外, 其它条件都尽可能做到相同其它条件都尽可能做到相同. 先用标准方法炼一炉先用标准方法炼一炉, 然后手建议的方法炼一炉然后手建议的方法炼一炉, 以后交以后交替进行替进行, 各炼了各炼了10炉炉, 其得率分别为其得率

17、分别为:标准方法标准方法: 78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3新方法新方法:79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1设这两个样本相互独立设这两个样本相互独立, 且分别来自正态总体且分别来自正态总体N( 1, 2)和和N( 2, 2), 1, 2, 2均未知均未知. 问建议的新的操作方法能否提问建议的新的操作方法能否提高得率高得率?四四. 基于成对数据的检验基于成对数据的检验(t-检验检验):设设X和和Y是两个正态总体是两个正态总体, 均值分别为均值分别为 1和和 2. X和

18、和Y不是相互独立的不是相互独立的, 取成对样本取成对样本:(X1,Y1), (X2, Y2),(Xn, Yn). 要检验要检验H0: 1 = 2, H1: 1 2.我们可以把这个问题转化成单个总体的假设检验我们可以把这个问题转化成单个总体的假设检验. 令令D=X-Y,它服从它服从N( 1- 2, 2),这里这里 1, 2, 2均未知均未知. Di=Xi-Yi(i=1, 2, , n)是来自是来自Z的样本的样本. 显然显然, 检验检验H0: 1= 2, H1: 1 2等价于检验等价于检验H0: 1- 2=0, H1: 1- 20, 于是把问题转化为上节于是把问题转化为上节的情况的情况.例例3 有

19、两台光谱仪有两台光谱仪Ix,Iy用来测量材料中某种金属的含量用来测量材料中某种金属的含量, 为为鉴定它们的测量结果有无显著的差异鉴定它们的测量结果有无显著的差异, 制备了制备了9件试块件试块 (它它们的成份们的成份, 金属含量金属含量,均匀性等均各不相同均匀性等均各不相同), 现在分别用这现在分别用这两台仪器对每一试块测量一次两台仪器对每一试块测量一次, 得到得到9对观察值如下对观察值如下: x(%) 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 y(%) 0.10 0.21 0.52 0.32 0.78 0.59 0.68 0.77 0.89问能否

20、认为这两台仪器的测量结果有显著的差异？问能否认为这两台仪器的测量结果有显著的差异？分析分析: 现分别作各对数据的差现分别作各对数据的差di=xi-yi如上表如上表, d=x-y(%) 0.10 0.09 -0.12 0.18 -0.18 0.11 0.12 0.13 0.11并假设并假设d1, d2, , d9来自正态总体来自正态总体N( d, 2), 这里这里 d, 2均均属未知属未知. 若两台机器性能一样若两台机器性能一样, 则各对数据的差异可看作则各对数据的差异可看作是随机误差是随机误差, 随机误差可以认为服从正态分布随机误差可以认为服从正态分布, 其均值为其均值为0, 因此本题归结为检

21、验假设因此本题归结为检验假设: H0: d=0, H1: d 03. 3. 正态总体方差的假设检验正态总体方差的假设检验(一一) 单个总体的情况单个总体的情况:例例1. 某厂生产的某种型号的电池某厂生产的某种型号的电池, 其寿命长期以来服从方其寿命长期以来服从方差差 2=5000(小时小时2)的正态分布的正态分布, 现有一批这种电池现有一批这种电池, 从它的从它的生产情况来看生产情况来看,寿命的波动性有所改变寿命的波动性有所改变.现随机取现随机取26只电池只电池, 测得其寿命样本方差为测得其寿命样本方差为s2=9200(小时小时2).问根据这一数据能问根据这一数据能否推断这批电池寿命的波动性较

22、以往的有显著的变化否推断这批电池寿命的波动性较以往的有显著的变化(取取 =0.02)?(二二) 两个总体的情况两个总体的情况:例例2. 在平炉上进行一项试验以确定改变操作方法的建议在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率是否会增加钢的得率, 试验是在同一只平炉上进行的试验是在同一只平炉上进行的. 每每炼一炉钢时除操作方法外炼一炉钢时除操作方法外, 其它条件都尽可能做到相同其它条件都尽可能做到相同. 先用标准方法炼一炉先用标准方法炼一炉, 然后手建议的方法炼一炉然后手建议的方法炼一炉, 以后交以后交替进行替进行, 各炼了各炼了10炉炉, 其得率分别为其得率分别为:标准方法标

23、准方法: 78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3新方法新方法:79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1设这两个样本相互独立设这两个样本相互独立, 且分别来自正态总体且分别来自正态总体N( 1, 12)和和N( 2, 22), 1, 2, 12, 22均未知均未知.试对数据检验假设试对数据检验假设( =0.01),H0: 12= 22, H1: 12 22.4. 4. 分布的拟合检验分布的拟合检验一一. 2检验法检验法:1. 基本思想基本思想:注意注意: 2检验法是基于以上定理下

24、得到的检验法是基于以上定理下得到的, 所以在所以在使用时必须注意到使用时必须注意到n要足够大要足够大,以及以及npi不太小不太小. 根据根据实践实践, 要求样本容量要求样本容量n不小于不小于50, 以及每一个以及每一个npi都不都不小于小于5,而且最好是在而且最好是在5以上以上, 否则应适当地合并否则应适当地合并Ai .例例1. 在一个实验中在一个实验中, 每隔一定时间观察一次由某种铀所放射每隔一定时间观察一次由某种铀所放射的到达计数器上的的到达计数器上的粒子数粒子数x, 共观察了共观察了100次次, 得结果如下得结果如下:i 0 1 2 3 4 5 6 7 8 9 10 11 12fi 1

25、 5 16 17 26 11 9 9 2 1 2 1 0 Ai A0 A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A12其中其中fi是观察到有是观察到有i个个粒子的次数粒子的次数. 从理论上考虑知从理论上考虑知, x应应服从参数为服从参数为的泊松分布的泊松分布 ( ).问问: 理论是否符合实际理论是否符合实际?(取取 =0.05). 即在水平即在水平0.05下检验假下检验假设设: H0:总体总体X ( ). (二二). 偏度偏度, 峰度检验峰度检验:5. 5. 秩和检验秩和检验1. 定义定义: 设设x为一总体为一总体, 将一容量为将一容量为n的样本观察值按的样本观

26、察值按自大到小的次序编号排列成自大到小的次序编号排列成 x(1)x(2)x(n),称称x(i)的足标的足标i为为x(i)的秩的秩, i=1,2,.2. 定义定义: 设自设自1, 2两总体分别抽取容量为两总体分别抽取容量为n1,n2的样本的样本,且设两样本独立且设两样本独立. 这里总假定这里总假定n1n2.将这将这n1+n2个观个观察值放在一起察值放在一起, 按自小到大的次序排列按自小到大的次序排列, 求出每个观求出每个观察值的秩察值的秩, 然后将属于第然后将属于第1个总体的样本观察值的秩个总体的样本观察值的秩相加相加,其和记为其和记为R1, 称为第称为第1样本的秩和样本的秩和. 其余观察值其余

27、观察值的秩的总和记为的秩的总和记为R2, 称为第称为第2样本的秩和样本的秩和.显然显然, R1, R2是离散型的随机变量是离散型的随机变量, 且有且有 R1+R2=(n1+n2)(n1+n2+1)/2.3. 假设检验问题假设检验问题: 设两个连续型总体设两个连续型总体, 它们的概率密度函数分别为它们的概率密度函数分别为f1(x),f2(x), 均为未知均为未知, 但已知但已知f1(x)=f2(x-a), a为未知为未知常数常数, 检验假设检验假设H0:a=0, H1:a0; H0:a=0, H1a0.分析分析: 当当H0成立时成立时, X和和Y的分布相同的分布相同, 每一个每一个Xi和和Yj出

28、现在混合样本中的某一位置上的可能性是相出现在混合样本中的某一位置上的可能性是相同的同的. 考虑样本容量较小的样本考虑样本容量较小的样本X. 直观上直观上, X1,X2,Xn1集中在混合样本中的左端或集中在混合样集中在混合样本中的左端或集中在混合样本中的右端的可能性都有比较小本中的右端的可能性都有比较小. 换句话说换句话说, R1比比较小较小(接近接近1+2+n1)或比较大或比较大(接近接近(n2+1)+(n2+2)+(n2+n1)的可能性都比较小的可能性都比较小.因此因此, 当当R1的观察的观察值值r1过分大或过分小时过分大或过分小时, 我们拒绝我们拒绝H0.注注: 对于临界点的求法对于临界点的求法:第八章第八章习题课习题课假设检验的基本思想，基本步骤，假设检验的基本思想，基本步骤，两类错误，两类错误，正态总体均值和方差的正态总体均值和方差的假设检验假设检验

展开阅读全文

概率论与数理统计：第六章样本及抽样分布 (2)

最新文档