《复习研究生应用数理统计》由会员分享,可在线阅读,更多相关《复习研究生应用数理统计(51页珍藏版)》请在金锄头文库上搜索。
1、 在前面我们曾经定义过事件的条件概率,同样在前面我们曾经定义过事件的条件概率,同样也可以考虑一个随机变量的条件分布,其条件与另也可以考虑一个随机变量的条件分布,其条件与另一随机变量的取值有关。一随机变量的取值有关。四四 条件分布条件分布整理ppt连续型连续型整理ppt定义定义整理ppt例例 整理ppt其中第一个参数是其中第一个参数是x x的线性函数,第二个参数与的线性函数,第二个参数与x x无关,此无关,此结论在一些统计问题中很重要。结论在一些统计问题中很重要。整理ppt例例1 设设 的联合分布密度为的联合分布密度为 解解 关于关于 的边缘密度为的边缘密度为 整理ppt于是于是整理ppt下面讨
2、论无偏估计方差的下界,达到这个下界的无偏估下面讨论无偏估计方差的下界,达到这个下界的无偏估量称为优效估计量(最小方差无偏估计)。量称为优效估计量(最小方差无偏估计)。定理:罗克拉美不等式(条件见书)定理:罗克拉美不等式(条件见书)罗克拉美不等式罗克拉美不等式 右端为罗克拉美下界,记为右端为罗克拉美下界,记为整理ppt 类似:类似:d.r.vd.r.v 注:有时能找到无偏估计使它的方差达到这个下界,注:有时能找到无偏估计使它的方差达到这个下界,有时达不到有时达不到整理ppt见书上见书上p60 p60 例例3.2.43.2.4和例和例3.2.5.3.2.5.整理ppt整理ppt整理ppt正确正确正
3、确正确假设检验的两类错误假设检验的两类错误 犯第一类错误的概率通常记为犯第一类错误的概率通常记为 犯第二类错误的概率通常记为犯第二类错误的概率通常记为 H0 为真为真H0 为假为假真实情况真实情况所作判断所作判断接受接受 H0拒绝拒绝 H0第一类错误第一类错误( (弃真弃真) )第二类错误第二类错误( (取伪取伪) )整理ppt 任何检验方法都不能完全排除犯错任何检验方法都不能完全排除犯错 假设检验的指导思想是控制犯第一类假设检验的指导思想是控制犯第一类误的可能性误的可能性. .理想的检验方法应使犯两类理想的检验方法应使犯两类错误的概率都很小错误的概率都很小, ,但在样本容量给定的但在样本容量
4、给定的情形下情形下, ,不可能使两者都很小不可能使两者都很小, ,降低一个降低一个, , 往往使另一个增大往往使另一个增大. .错误的概率不超过错误的概率不超过 , , 然后然后, ,若有必要若有必要, ,通通过增大样本容量的方法来减少过增大样本容量的方法来减少 . .整理ppt1 非正态总体参数的假设检验非正态总体参数的假设检验设总体 X 服从参数为 p 的(01)分布, 即 设 为 X 的样本, 检验假设 1 1(01)(01)分布参数的假设检验分布参数的假设检验整理ppt由于 因此由中心极限定理可知, 当 成立且样本容量 n充分大时,统计量 服从标准正态分布N(0,1). =该假设检验问
5、题的拒绝域为 近似地整理ppt例例1 1 某种产品在通常情况下次品率为5%. 现在从生产出的一批产品中随机地抽取50件进行检验, 发现有4件次品. 问能否认为这批产品的次品率为5%? (=0.05)解解 设这批产品的次品率为 p. 在这批产品中任 任意取一件产品,定义随机变量 X 如下 整理ppt检验假设 该假设检验问题的拒绝域为 现在 统计量U的值为 整理ppt=接受假设 =可以认为这批产品的次品率为5% 整理ppt2.2.总体均值的假设检验总体均值的假设检验假设总体X 的均值为, 方差为 为 X 的样本,检验假设 由中心极限定理知,当样本容量n充分大时, 近似地服从标准正态分布N(0,1)
6、 整理ppt由于样本方差 为 的无偏估计量, =可以用 近似代替 ,并且当 为真 且样本容量n充分大时,统计量 仍近似地服从标准正态分布N(0,1) =该假设检验问题的拒绝域为 整理ppt例例2 2 某电器元件的平均电阻一直保持在2.64. 改变加工工艺后, 测得100个元件的电阻, 计算得平均电阻为 2.58 , 样本标准差为0.04 . 在显著性水平 =0.05下, 判断新工艺对此元件的平均电阻有无显著影响. 解解 设该电器元件的电阻为X, 其均值为 检验假设 拒绝域为 整理ppt现在 统计量U的值为 =拒绝假设 接受假设 =新工艺对电子元件的平均电阻有显著影响. 整理ppt3.3.两个总
7、体均值的假设检验两个总体均值的假设检验 设总体 和 相互独立, 的样本, 是 是 Y 的样本. 记 设总体 X的均值为 ,方差为 总体 Y的均值为 ,方差为 整理ppt的拒绝域. 由中心极限定理知,当样本容量 和 都充分大时, 近似地服从标准正态分布 由于样本方差 和 分别为 和 的无偏估计量,因此 可以分别用 和 近似代替 和 ,并且当 求假设检验问题 整理ppt和 近似地服从标准正态分布 ,从而当原假设 成立时, 统计量 仍近似地服从标准正态分布. 都充分大时, =当 成立且 都充分大时, 统计量U的值应该在零附近摆动,整理ppt当 过大时就认为 不成立. =该假设检验问题的拒绝域为 整理
8、ppt例例3 两台机床加工同一中轴承,现在从他们加工的轴承中分别随机地抽取200根和100根,测量其椭圆度(单位:mm),经计算得 能否认为这两台机床加工的轴承的平均椭圆度是相同的(=0.05)解解设这两台机床加工的轴承的椭圆度分别为X,Y 且 检验假设 整理ppt由于题目给出的两个样本都是大样本,因此该假设检验问题的拒绝域为 现在 =拒绝原假设 即认为这两台机床加工的轴承的平均椭圆度是不相同的. 整理ppt2 分布拟合检验分布拟合检验设总体X的实际分布函数为F(x),它是未知的. 为来自总体 X的样本. 根据这个样本来检验总体X的分布函数F(x) 是否等于某个给定的分布函数 F0(x),即检
9、验假设 : 整理ppt注意注意: : 若总体 X 为离散型的, 则 相当于 总体 X 的分布律为 若总体 X 为连续型的, 则 相当于总体 X 的 概率密度为 f(x) .整理ppt(1)若中 的分布函数 不含未知参数. 记 为 的所有可能取值的全体, 将 分为k个两两互不相交的子集 以 表示样本观察值 中落入 的个数,= 在n次试验中,事件 Ai发生的频率为 fi /n另一方面,当H0 0为真时, 可以根据H0所假设的 X 的分布函数来计算 整理ppt选取统计量 来度量样本与H0中所假设的分布的吻合程度,hi是给定的常数。 如果选取 则上述统计量变成 整理ppt定理定理1 1 (皮尔逊)(皮
10、尔逊)当H0为真且n充分大时, 统计量 近似服从 分布. 由定理1, 若给定显著性水平,则前述假设检验问题的拒绝域为 整理ppt(2)若H0中X 的的分布函数含有未知参数. 此时, 首先在假设下利用样本求出未知参数的最大似然估计, 以估计值作为参数值, 然后再根据 H0中所假设的 X 的分布函数 F(x)求出 pi的估计值 并在 中以 代替 , 得到统计量 整理ppt为真且 充分大时, 统计量定理定理2 2 (皮尔逊)(皮尔逊)当 近似服从 分布, 其中r是 X的分布函数 F(x)包含的未知参数的个数. 若给定显著性水平,则前述假设检验问题的拒绝域为 整理ppt注意:注意:运用 检验法检验总体
11、分布, 把样本数据进 (1)大样本, 通常取(2)要求各组的理论频数 或 (3)一般数据分成7到14组. 有时为了保证各组 行分类时,组数可以少于7组整理ppt例例1 1 孟德尔在著名的豌豆杂交实验中, 用结黄色圆形种子与结绿色皱形种子的纯种豌豆作为亲本进行杂交, 将子一代进行自交得到子二代共556株豌豆, 发现其中有四种类型植株 (黄圆)(黄皱) (绿圆)(绿皱) 总计 315株 101株 108株 32株 556株 试问这些植株是否符合孟德尔所提出的 的理论比例 整理ppt解解 检验假设 这些植株符合的理论比例. 这些植株不符合 的理论比例. 由 由 的理论比例可知 由n=556,得 整理
12、ppt而 计算得 由 =0.05 ,自由度查 分布表得 =在=0.05下接受=这些植株是符合孟德尔所提出的 的理论比例整理ppt 上述置信区间中置信限都是双侧的,但上述置信区间中置信限都是双侧的,但对于有些实际问题,人们关心的只是参数在对于有些实际问题,人们关心的只是参数在一个方向的界限一个方向的界限. 例如对于设备、元件的使用寿命来说,平均例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了寿命过长没什么问题,过短就有问题了. 这时,可将置信上限取这时,可将置信上限取为为+,而只着眼于置信下,而只着眼于置信下限,这样求得的置信区间叫限,这样求得的置信区间叫单侧置信区间单侧
13、置信区间.三、单侧置信区间整理ppt于是引入单侧置信区间和置信限的定义:于是引入单侧置信区间和置信限的定义:满足满足设设 是是 一个待估参数,给定一个待估参数,给定 若由样本若由样本X1,X2,Xn确定的统计量确定的统计量则称区间则称区间 是是 的置信水平为的置信水平为 的的单侧置信区间单侧置信区间.称为单侧置信下限称为单侧置信下限.整理ppt又若统计量又若统计量 满足满足则称区间则称区间 是是 的置信水平为的置信水平为 的的单侧置信区间单侧置信区间. 称为单侧置信上限称为单侧置信上限.整理ppt设灯泡寿命服从正态分布设灯泡寿命服从正态分布. 求灯泡寿命均求灯泡寿命均值值 的置信水平为的置信水
14、平为0.95的单侧置信下限的单侧置信下限. 例例4 从一批灯泡中随机抽取从一批灯泡中随机抽取5只作寿命试只作寿命试验,测得寿命验,测得寿命X(单位:小时)如下:(单位:小时)如下:1050,1100,1120,1250,1280由于方差由于方差 未知,未知,解:解: 的点估计取为样本均值的点估计取为样本均值 选取统计量为整理ppt 对给定的置信水平对给定的置信水平 ,确定分位数,确定分位数使使即即于是得到于是得到 的置信水平为的置信水平为 的单侧置的单侧置信区间为信区间为 整理ppt 将样本值代入得将样本值代入得的置信水平为的置信水平为0.95的单侧置信下限是的单侧置信下限是1065小时小时的
15、置信水平为的置信水平为 的单侧置信下限为的单侧置信下限为即即整理ppt例例5 5 为估计制造某种产品所需要的单件平均工时为估计制造某种产品所需要的单件平均工时(单位:小时),现制造(单位:小时),现制造5 5件,记录每件所需工时如下件,记录每件所需工时如下10.5 11.0 11.2 12.5 12.810.5 11.0 11.2 12.5 12.8假设制造单位产品所需工时假设制造单位产品所需工时试求平均工时的置信水平为试求平均工时的置信水平为0.950.95的单侧置信上限的单侧置信上限. .解解 由于由于, ,其中其中未知未知, ,因此因此整理ppt对于给定的对于给定的, ,由由分布的上分布的上 分位点的定义分位点的定义, ,存在存在, ,使得使得而而, , 所以所以, ,整理ppt即即 故故的单侧置信区间为的单侧置信区间为单侧置信上限为单侧置信上限为整理ppt, , 经计算得经计算得, , 由由, , 得得从而可得单侧置信上限从而可得单侧置信上限因此因此, , 加工这种产品的平均工时不超过加工这种产品的平均工时不超过12.5512.55小时小时的可靠程度是的可靠程度是95%.95%.整理ppt此课件下载可自行编辑修改,供参考!感谢您的支持,我们努力做得更好!