统计学导论、统计的检验问题

上传人:j****9 文档编号:47404740 上传时间:2018-07-02 格式:PDF 页数:27 大小:743.31KB
返回 下载 相关 举报
统计学导论、统计的检验问题_第1页
第1页 / 共27页
统计学导论、统计的检验问题_第2页
第2页 / 共27页
统计学导论、统计的检验问题_第3页
第3页 / 共27页
统计学导论、统计的检验问题_第4页
第4页 / 共27页
统计学导论、统计的检验问题_第5页
第5页 / 共27页
点击查看更多>>
资源描述

《统计学导论、统计的检验问题》由会员分享,可在线阅读,更多相关《统计学导论、统计的检验问题(27页珍藏版)》请在金锄头文库上搜索。

1、第六讲第六讲总体参数的假设检验总体参数的假设检验一、假设检验的过程和逻辑一、假设检验的过程和逻辑一、假设检验的过程和逻辑一、假设检验的过程和逻辑二、假设检验问题的提法二、假设检验问题的提法三、三、三、三、p p p p- - - -值的应用值的应用值的应用值的应用四、假设检验时的两类错误四、假设检验时的两类错误1 假设检验概述1 假设检验概述一、假设检验的基本概念一、假设检验的基本概念假设检验是统计推断的另一种方式,它与区间估计的差别假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设

2、检验是以小概率为标准,对总体的状况所做范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。假设检验与区间估计结合起来,构成出的假设进行判断。假设检验与区间估计结合起来,构成完整的统计推断内容。完整的统计推断内容。假设检验分为两类:一类是参数假设检验,假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。另一类是非参数假设检验。企图肯定什么现象很难,而否定却要相对容易得多(否企图肯定什么现象很难,而否定却要相对容易得多(否定其对立面,如数学方法中的反证法),这就是假设检验背定其对立面,如数学方法中的反证法),这就是假设检验背后的哲学。后的哲学。在假设检验中,一般要设立一个

3、原假设在假设检验中,一般要设立一个原假设而设立该假设的动而设立该假设的动机主要是企图利用人们掌握的反映现实世界的数据来找出假机主要是企图利用人们掌握的反映现实世界的数据来找出假设与现实之间的矛盾,从而否定这个假设设与现实之间的矛盾,从而否定这个假设。在多数统计教科书中(除理论探讨外)假设检验都是以在多数统计教科书中(除理论探讨外)假设检验都是以否定否定原假设为目标。原假设为目标。 因此欲由数据证实某个猜测,就将其对立面设为原假设,因此欲由数据证实某个猜测,就将其对立面设为原假设,希望通过数数据的事实否定原假设,从而达到目的。希望通过数数据的事实否定原假设,从而达到目的。但如果证据不足,无法否定

4、原假设。这时我们也说接受原但如果证据不足,无法否定原假设。这时我们也说接受原假定,但不能说明原假设正确。假定,但不能说明原假设正确。例例1:消费者协会接到消费者投诉,指控品牌纸包装:消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为的容量为250毫升。消费者协会从市场上随机抽取毫升。消费者协会从市场上随机抽取50盒盒该品牌纸包装饮品,测试发现平均含量为该品牌纸包装饮品,测试发现平均含量为248毫升,小毫升,小于于250毫升。这是生产中正常的波动,还是厂商的有意毫升。这是生产中正常的波动,还是厂商的有意行为

5、?消费者协会能否根据该样本数据,判定饮料厂行为?消费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢?商欺骗了消费者呢?消费者协会实际要进行的是一项统计检验工作。检消费者协会实际要进行的是一项统计检验工作。检验总体平均验总体平均 =250是否成立。这就是一个原假设是否成立。这就是一个原假设(null hypothesis),通常用,通常用H0 表示,即:表示,即:0:250H=与原假设对立的是备选假设与原假设对立的是备选假设(alternative hypothesis) ,备备选假设是在原假设被否定时另一种可能成立的结论。备选假设是在原假设被否定时另一种可能成立的结论。备选假设比原假设还

6、重要,这要由实际问题来确定,选假设比原假设还重要,这要由实际问题来确定, 一般把期望出现的结论作为备选假设。它通常由实际一般把期望出现的结论作为备选假设。它通常由实际 所代表的方向来确定,即通常被认为可能比零假设更符所代表的方向来确定,即通常被认为可能比零假设更符合数据所代表的现实。合数据所代表的现实。1HH1:|2uUP对给定的显著性水平对给定的显著性水平 ,可以在,可以在N(0,1)表中查到分位表中查到分位点的值点的值,使,使2 u罐装可乐的容量按标准应在罐装可乐的容量按标准应在355毫升,一批可乐出厂前应进行抽样检毫升,一批可乐出厂前应进行抽样检查,现抽查了查,现抽查了n罐,测得容量为罐

7、,测得容量为x1 ,x2 ,xn ,其平均值为其平均值为370问这一批可乐问这一批可乐的容量是否合格?的容量是否合格?拒绝域为:拒绝域为:W:2| uU 如果由样本值算得该统计量的实测值如果由样本值算得该统计量的实测值 落入区域落入区域W,则拒绝,则拒绝H0 ;否则,不能拒绝;否则,不能拒绝H0 .小概率事件小概率事件一个实例一个实例( =0.05)=例例2 某工厂生产的一种螺钉,标准要求长度是某工厂生产的一种螺钉,标准要求长度是32.5毫米毫米. 实际实际生产的产品,其长度生产的产品,其长度X假定服从正态分布假定服从正态分布未知,现未知,现从该厂生产的一批产品中抽取从该厂生产的一批产品中抽取

8、6件件, 得尺寸数据如下得尺寸数据如下:),(2 N2 32.56, 29.66, 31.64, 30.00, 31.87, 31.03问这批产品是否合格?问这批产品是否合格? 分析:这批产品分析:这批产品(螺钉长度螺钉长度)的全体组成问题的总的全体组成问题的总体体X. 现在要现在要 检验检验E(X)是否为是否为32.5.提出原假设和备择假设提出原假设和备择假设 5 .32:5 .32:10= HH第一步:第一步:已知已知 X),(2 N2 未知未知.第二步:第二步:能衡量差异大小能衡量差异大小 且分布已知且分布已知取一检验统计量,在取一检验统计量,在H0成立下成立下求出它的分布求出它的分布)

9、5(65 .32tSXt=第三步:第三步:对给定的显著性水平对给定的显著性水平 =0.01,查表确定临界值,查表确定临界值032245500502.)()(.= tt,使使 =)5(|2ttP得否定域得否定域W: |t |4.0322故不能拒绝故不能拒绝H H0 0 . .第四步:第四步:将样本值代入算出统计量将样本值代入算出统计量 t 的实测值的实测值,| t |=2.997”)某个值的情况(即现状更偏向均值)某个值的情况(即现状更偏向均值(“”)某个值的情况)。)某个值的情况)。 取备选假设为均值大于或小于某个值的检验称为单尾检验取备选假设为均值大于或小于某个值的检验称为单尾检验(one-

10、tailed test,也称为单侧检验或单边检验,也称为单侧检验或单边检验)。下面举一个选。下面举一个选假设为均值大于(假设为均值大于(“”)某个值的例子。)某个值的例子。上面例子的备选假设选择了上面例子的备选假设选择了“”,相应的检验,相应的检验称为称为所谓所谓的的双双尾检验尾检验(two tailed test,也称为双侧检验或双边检验,也称为双侧检验或双边检验)问题,即问题,即0010:;:=HH/21/2-Z/2 Z/2Z0 0 Z双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验在例在例1中,按历史资料,总体的标准差是中,按历史资料,总体的标准差是4毫升。我们通过检验总毫升。我们通过检

11、验总体均值是否等于体均值是否等于250毫升,来判断饮料厂商是否欺骗了消费者。毫升,来判断饮料厂商是否欺骗了消费者。程序如下:程序如下:第一步第一步:确定原假设与备选假设。:确定原假设与备选假设。 :=250;:;: HH取统计量取统计量否定域为否定域为W W : :01. 0uU =2.33=2.33是是一小概率事件一小概率事件01. 0uU 代入代入=1.2, n=30,并由样本值计算得统计,并由样本值计算得统计 量量U的实测值的实测值U=2.512.33故拒绝原假设故拒绝原假设H0 .落入否定域落入否定域对于正态总体均值的检验对于正态总体均值的检验根据一个样本对其总体均值大小进行检验根据一

12、个样本对其总体均值大小进行检验 例例一个顾客买了一包标有一个顾客买了一包标有500g重的一包红糖,觉得份量不足,重的一包红糖,觉得份量不足,于是找到监督部门;当然他们会觉得一包份量不够可能是于是找到监督部门;当然他们会觉得一包份量不够可能是随随机机的 。 于 是 监 督 部 门 就 去 商 店 称 了的 。 于 是 监 督 部 门 就 去 商 店 称 了 50 包 红 糖 ( 数 据 在包 红 糖 ( 数 据 在sugar.txt);其中均值(平均重量)是);其中均值(平均重量)是498.35g;这的确比;这的确比500g 少,但这是否能够说明厂家生产的这批红糖平均起来不够少,但这是否能够说明

13、厂家生产的这批红糖平均起来不够份份量量呢?呢? 于是需要统计检验。可以画出这些重量的直方图于是需要统计检验。可以画出这些重量的直方图 Histogram of Sugar WeightFrequency4904955005050246810根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验 这个直方图看上去象是正态分布的样本。不妨假定这个直方图看上去象是正态分布的样本。不妨假定这一这一批批袋袋装装红糖有正态分布。红糖有正态分布。 由于厂家声称每袋由于厂家声称每袋500g(标明重量),因此零假设为总体均值等(标明重量),因此零假设为总体均值等于于500g(被怀疑对象总是放在

14、零假设);(被怀疑对象总是放在零假设);而且由于样本均值少于而且由于样本均值少于500g(这是怀疑的根据这是怀疑的根据),把备选假设定为,把备选假设定为总体均值少于总体均值少于500g(备选假设为单向不等式的检验称为单尾检(备选假设为单向不等式的检验称为单尾检验验,为不等号为不等号“”的称为双尾检验的称为双尾检验)01:500;:500=HH选用检验统计量选用检验统计量0 /=XTsn符号中的符号中的0通常表示为零假设中的均值(这里是5通常表示为零假设中的均值(这里是50 00 0)。在零假)。在零假设之下,它有自由度为设之下,它有自由度为n n-1=49的t分布。-1=49的t分布。计算结果

15、是计算结果是t t=-2.696=-2.696(也也称称为为t t值),值), 同时得到同时得到p-p-值为值为0.000.005,看来可以选择显著性水平为5,看来可以选择显著性水平为0.0050.005,并并拒拒绝绝零零假设,而错误拒绝的概率为0.005。假设,而错误拒绝的概率为0.005。-5-4-3-2-101234500.050.10.150.20.250.30.350.4t valueDensity of t(59)Tail Probability for t(59)t=-2.696p-value=0.005且且PT -2.696=0.005 (p-值)值)统计量统计量t=-2.69

16、60 /xtsn=由于小概率并不是不会发生,仅仅发由于小概率并不是不会发生,仅仅发生的生的概率概率很小很小罢了罢了,拒绝正确零假设的错误常被称为第一类错误(拒绝正确零假设的错误常被称为第一类错误(type I error)。)。在备选假设正确时反在备选假设正确时反而说而说零假零假设正确的错误,称为第二类错设正确的错误,称为第二类错误(误(type II error)。在一般的假设检验问题中,由于备选假)。在一般的假设检验问题中,由于备选假设不是一个点,所以无法算出犯第二类错误的概率。设不是一个点,所以无法算出犯第二类错误的概率。假设和备选假设哪一个正确,是确定性的,没有概率可假设和备选假设哪一个正确,是确定性的,没有概率可言。而可能犯错误的是人。言。而可能犯错误的是人。 负责任的态度是无论做出什么决策,都

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号