假设检验和方差分析一课件

上传人:我*** 文档编号:141385225 上传时间:2020-08-07 格式:PPT 页数:70 大小:514KB
返回 下载 相关 举报
假设检验和方差分析一课件_第1页
第1页 / 共70页
假设检验和方差分析一课件_第2页
第2页 / 共70页
假设检验和方差分析一课件_第3页
第3页 / 共70页
假设检验和方差分析一课件_第4页
第4页 / 共70页
假设检验和方差分析一课件_第5页
第5页 / 共70页
点击查看更多>>
资源描述

《假设检验和方差分析一课件》由会员分享,可在线阅读,更多相关《假设检验和方差分析一课件(70页珍藏版)》请在金锄头文库上搜索。

1、假设检验,第一节 假设检验的一般问题 第二节 一个正态总体的参数检验 第三节 两个正态总体的参数检验 第四节 非参数检验,假设检验在统计方法中的地位,统计方法,描述统计,推断统计,参数估计,第一节 假设检验的一般问题,一、假设检验和抽样估计的不同点 二、假设检验的概念与思想 三、假设检验(一个实例) 四、假设检验的步骤 五、假设检验中的两类错误,一、假设检验和抽样估计的不同点,抽样估计:通过样本的观察结果来推断总体参数的取值范围以及得到此结论的可靠程度。 假设检验:预先对总体参数的取值作出假定,然后用样本数据来验证,从而作出是接受还是拒绝该假设的结论。,二、假设检验的概念与思想,对总体参数的一

2、种看法 总体参数包括总体均值、比例、方差等,分析之前必需陈述,我认为该企业生产的零件的平均长度为4厘米!,什么是假设?,什么是假设检验?,事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立。包括参数假设检验和非参数假设检验,假设检验的基本思想,. 因此我们拒绝假设 = 50,样本均值,m,= 50,抽样分布,H0,在一次试验中,一个几乎不可能发生的事件发生的概率称为小概率。在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设。,小概率原理,假设检验的过程(提出假设抽取样本作出决策),三、假设检验(实例),某地区水土中缺乏一种微量元素,根据医学研究结果可知,人们如果摄取

3、这种元素过少,脑功能可能受影响,因此可推测该地区儿童的智力水平可能低于一般水平。心理学家使用某一标准化智力检验方法,对该地区随机选取36名儿童进行智力测验,得到智力分数的平均值是94分,已知总体标准差为15分,问该地区儿童的智力水平是否和一般水平(100分)有明显差异?,拒绝假设接受假设,原假设,备择假设,四、假设检验的步骤,1、提出原假设和备择假设 2、确定适当的检验统计量 3、规定显著性水平,查出临界值,确定拒绝域和接受域 4、计算检验统计量的值 5、作出统计决策,提出原假设和备择假设, 什么是原假设?(Null Hypothesis) 1、陈述待检验的假设,又称“0假设” 2、开始时总假

4、设原假设是正确的 3、总是有等号 , 或 4、表示为 H0 H0: 某一数值 例如, H0: 3190(克) 5、原假设可能会被否决, 什么是备择假设?(Alternative Hypothesis) 1、与原假设相反的假设 2、总是有不等号 , 或 3、表示为 H1 H1: 某一数值,或 某一数值 例如, H1: 3910(克),或 3910(克) 4、备择假设不一定会被接受,提出原假设和备择假设, 什么检验统计量? 1、用于假设检验问题的统计量 2、选择统计量的方法与参数估计相同,需考虑 是大样本还是小样本 总体方差已知还是未知 3、检验统计量的基本形式为,确定适当的检验统计量,规定显著性

5、水平, 什么显著性水平? 1、是一个概率值 2、原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域 3、表示为 (alpha) 常用的 值有0.01, 0.05, 0.10 4、由研究者事先确定,双侧检验(显著性水平与拒绝域 ),双侧检验(显著性水平与拒绝域 ),双侧检验(显著性水平与拒绝域 ),双侧检验(显著性水平与拒绝域 ),作出统计决策,1、计算检验的统计量 2、根据给定的显著性水平,查表得出相应的临界值Z或Z/2 3、将检验统计量的值与 水平的临界值进行比较 4、得出接受或拒绝原假设的结论,五、假设检验中的两类错误(决策风险),1.第一类错误(弃真错误) 原假设为真时拒绝原假设 第

6、一类错误的概率为 被称为显著性水平 2.第二类错误(取伪错误) 原假设为假时接受原假设 第二类错误的概率为(Beta),H0: 无罪,假设检验中的两类错误 (决策结果),假设检验就好像一场审判过程,统计检验过程,错误和 错误的关系,你不能同时减少两类错误!,和的关系就像翘翘板,小就大, 大就小,参数检验和非参数检验,对定量数据进行检验有参数检验和非参数检验两种。 参数方法:在检验过程中比较的是总体参数(最常见的是总体均数),这种检验方法需要事先对数据的分布做出假定,如t检验要求数据服从正态分布、方差相同等。 非参数方法: (1)不依赖于总体分布。参数假设检验除了大样本情况下进行的参数假设检验外

7、,期于都是假定总体服从某一分布的检验。 (2)非参数假设检验适用于比较低的计量水准,如等级的、顺序的计量,如中位数计量。,第二节 一个正态总体的参数检验,一、总体方差已知时的均值检验 二、总体方差未知时的均值检验 三、总体比例的假设检验,一个总体的检验,假设检验的步骤,1、提出原假设和备择假设 2、确定适当的检验统计量 3、规定显著性水平,查出临界值,确定拒绝域和接受域 4、计算检验统计量的值 5、作出统计决策,一、总体方差已知时的均值检验(双尾 Z 检验) (2 已知),1、假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 2、原假设为:H0: =0;备择假设为:

8、H1: 0 使用z-统计量,均值的双尾 Z 检验(实例),例:某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为= 0.025 。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05),均值的双尾 Z 检验(计算结果),H0: u = 0.081 H1: u 0.081 = 0.05 n = 200 临界值(s):,检验统计量:,决策:,结论:,拒绝H0,有证据表明新机床加工的零件的椭圆度与以前有显著差异,二、总体方差未知的均值检验(

9、双尾 t 检验)(2 未知),1、假定条件 总体为正态分布 如果不是正态分布, 只有轻微偏斜和大样本 (n 30)条件下 2、使用t 统计量,均值的双尾 t 检验 (实例),例:厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?,均值的双尾 t 检验 (计算结果),H0: = 1000 H1: 1000 = 0.05 df = 9 - 1 = 8 临界值(s):,检验统计量:,在 = 0.05的水平上接受H0,有证据表明这天自动包装机

10、工作正常,决策:,结论:,三、总体比例的假设检验,适用的数据类型,一个总体比例的 Z 检验,1、假定条件 有两类结果 总体服从二项分布 可用正态分布来近似 2、比例检验的 z 统计量,P0为假设的总体比例,一个总体比例的 Z 检验 (实例),例:某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了200的家庭,其中68个家庭拥有电脑。试问研究者的估计是否可信? ( = 0.05),一个样本比例的 Z 检验 (结果),H0: p = 0.3 H1: p 0.3 = 0.05 n = 200 临界值(s):,检验统计量:,在 = 0.05的水平上接受H0,有证据表明研究者的估计可信,决策:,

11、结论:,一、二个独立样本的均值检验 (一)Z检验(12、 22 已知) (二) t检验 (12、 22未知,但相等),检验两个不相关的样本是否来自具有相同均值的总体: (1)购买某产品的顾客与不购买某产品的顾客平均收入是否相同? (2)男女在成就、智商和其他性格方面的均值差异; (3)检验两地的平均房价是否有差异? (4)检验两种品牌的灯泡的寿命均值是否有差异?,二、二个相关(配对或匹配)样本的均值检验,检验两个相关的样本是否来自具有相同均值的总体,如,测度员工在技 术培训前后某项技能的成绩,要求比较培训前后成绩均值是否有显著差 异?比较公司去年和今年的经营绩效是否有显著差异?,第三节 二个正

12、态总体的参数检验,一、两个独立样本均值之差的抽样分布,(一)两个总体均值之差的Z检验 (12、 22 已知),1、假定条件 两个样本是独立的随机样本 两个总体都是正态分布 若不是正态分布, 可以用正态分布来近似(n130和 n230) 2、原假设:H0: 1- 2 =0;备择假设:H1: 1- 2 0 检验统计量为,两个总体均值之差的Z检验 (例子),例:有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本容量分别为n1=32,n2=40,测得x2=

13、 50公斤,x1= 44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别? ( = 0.05),两个总体均值之差的Z检验(计算结果),H0: 1- 2 = 0 H1: 1- 2 0 = 0.05 n1 = 32,n2 = 40 临界值(s):,检验统计量:,决策:,结论:,拒绝H0,有证据表明两种方法生产的产品其抗拉强度有显著差异,例:某大学欲比较大学毕业后留校工作与分配到其他岗位的人工资水平的差别,因为工资还与工龄等其他因素有关,因此抽选大学毕业后满10年在校工作的教师50人,另外抽选大学毕业后满10年在机关、企业工作的人员进行比较,取得的数据如下。试比较大学毕业后留校当教师与分配在机

14、关企业等工作人员的工资水平是否有差异?(=0.05),两个总体均值之差的Z检验 (12、 22 未知,大样本),(二)两个总体均值之差的 t 检验 (12、 22未知,小样本),1、检验具有等方差的两个总体的均值 2、假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知但相等12 = 22 3、检验统计量,其中:,两个总体均值之差的 t 检验 (例子),例:一个车间研究用两种不同的工艺组装某种产品所用的时间是否相同。让一个组的10名工人用第一种工艺组装该产品,平均所需时间为26.1分钟,样本标准差为12分钟;另一组8名工人用第二种工艺组装,平均所需时间为17.6分钟,样本

15、标准差为10.5分钟。已知用两种工艺组装产品所用时间服从正态分布,且s12s22 。试问能否认为用第二种方法组装比用第一中方法组装更好?( = 0.05),两个总体均值之差的 t 检验(计算结果),H0: 1- 2 0 H1: 1- 2 0 = 0.05 n1 = 10,n2 = 8 临界值(s):,检验统计量:,决策:,结论:,接受H0,没有证据表明用第二种方法组装更好,二、二个相关(配对或匹配)样本的均值检验(配对样本的 t 检验),1、检验两个相关总体的均值 配对或匹配 重复测量 (前/后) 2、假定条件 两个总体都服从正态分布 如果不服从正态分布,可用正态分布来近似 (n1 30 ,

16、n2 30 ),有时为了比较两种产品,或两种仪器、两种方法等的差异,我们常在相同的条件下作对比实验,得到一批成对的观察值,然后分析观察数据作出判断配对比较法。,配对样本的 t 检验(数据形式),假设差值Di来自正态总体,若两样本无差异,则差值应属于随机误差,而随机误差可以认为服从正态分布,均值为0。,配对样本的 t 检验(检验统计量),样本均值,样本标准差,自由度df nD - 1,统计量,例:一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5公斤以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:,配对样本的 t 检验(例子),在 = 0.05的显著性水平下,调查结果是否支持该俱乐部的声称?,配对样本的 t 检验(计算表),配对样本的 t 检验(计算结果),样本均值,样本标准差,H0: m1 m2 8.5 H1: m1 m2 8.5 a = 0.05 df = 10 - 1 = 9 临界值(s):,检验统计

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号