均值检验(T检验)目标:了解T检验及其应用主要内容: 单个正态总体均值的单个正态总体均值的Z Z或或T T检验检验 两个正态总体均值的两个正态总体均值的T T检验检验 成对数据成对数据T T检验检验T检验用于在已知变量为正态总体但未知总标准检验用于在已知变量为正态总体但未知总标准差的情况下,对总体均值进行区间估计或假设检差的情况下,对总体均值进行区间估计或假设检验,是在现实问题中非常常用的一种检验验,是在现实问题中非常常用的一种检验T T检验检验T检验用于均值检验用来检验标准试样测定检验用于均值检验用来检验标准试样测定结果的平均值与标准值之间是否有显著差异结果的平均值与标准值之间是否有显著差异也就是将样本的平均值与目标值或与其它样本也就是将样本的平均值与目标值或与其它样本的平均值相比较的平均值相比较当影响因子为计数型,响应变量为计量型当影响因子为计数型,响应变量为计量型时,可采用时,可采用T T检验检验T T检验有单侧检验和双侧检验之分通检验有单侧检验和双侧检验之分通过查看过查看P P值确定样本之间均值是否存在值确定样本之间均值是否存在显著差异显著差异T T检验检验1 1、连续数据呈现正态分布(如果数据为非正、连续数据呈现正态分布(如果数据为非正态分布,则需要进行数据转换,将非正态态分布,则需要进行数据转换,将非正态数据转换成正态数据)数据转换成正态数据)2 2、数据来自稳定的数据源、数据来自稳定的数据源3 3、数据之间彼此独立、数据之间彼此独立4 4、数据具有代表性、数据具有代表性 T T检验的前提条件检验的前提条件数据数据类型类型比较内容比较内容工具工具连连续续数数据据一组数据的平均值与目标值相比较一组数据的平均值与目标值相比较1 1样本样本t/Zt/Z两组数据的平均值相比较两组数据的平均值相比较2 2样本样本t t两组成对数据的平均值相比较(或当数据两组成对数据的平均值相比较(或当数据匹配时,比较两组平均值)匹配时,比较两组平均值)成对成对t tT T检验的类型检验的类型单样本单样本Z Z检验检验单样本单样本Z Z检验使用条件检验使用条件检验整体均值是否与目标数值相等检验整体均值是否与目标数值相等样本量大,样本量大,n=30n=30总体标准差已知或者用样本标准差总体标准差已知或者用样本标准差S S代替代替单样本单样本Z Z检验检验从历史记录上得知,快递公司投送发往美国的邮件,从历史记录上得知,快递公司投送发往美国的邮件,平均投递时间为平均投递时间为8080小时,标准差为小时,标准差为1414小时。
现随机抽小时现随机抽取了取了4040份邮件的投递时间记录,试分析发往美国的邮份邮件的投递时间记录,试分析发往美国的邮件的平均投递时间是否低于件的平均投递时间是否低于8080小时?取显著水平小时?取显著水平=0.05.=0.05.数据数据BS-BS-投递时间投递时间单样本单样本Z Z检验检验例:例:单样本单样本Z Z检验检验1 1、建立假设:、建立假设:H0H0:=80=80H1H1:80802 2、样本容量的确定、样本容量的确定统计统计 功效和样本数量功效和样本数量1Z1Z单样本单样本功效和样本数量功效和样本数量 单样本单样本 Z Z 检验检验检验平均值检验平均值 = = 零(与零(与 零)零)计算功效的平均值计算功效的平均值 = = 零零 + + 差值差值Alpha = 0.05 Alpha = 0.05 假定标准差假定标准差 = 14 = 14 样本样本差值差值 数量数量 目标功效目标功效 实际功效实际功效 7.4 47 0.95 0.951918 7.4 47 0.95 0.951918 7.4 38 0.90 0.902920 7.4 38 0.90 0.902920 7.4 29 0.80 0.812321 7.4 29 0.80 0.812321 单样本单样本Z Z检验检验单样本单样本Z Z检验检验3、正态性检验、正态性检验统计统计正态性检验正态性检验单样本单样本Z Z检验检验4、进行检验、进行检验单样本单样本Z Z检验检验单样本单样本 Z: Z: 投递时间投递时间 mu = 80 mu = 80 与与 80 80 的检验的检验假定标准差假定标准差 = 14 = 14 平均值平均值变量变量 N N 平均值平均值 标准差标准差 标准误标准误 95% 95% 上限上限 Z P Z P投递时间投递时间 40 72.60 11.44 2.21 76.24 -3.34 0.000 40 72.60 11.44 2.21 76.24 -3.34 0.000P=0.0350.05P=0.0350 -单边假设检验单边假设检验H0: 0, Ha:0-单边假设检验单边假设检验单样本单样本T T检验检验骤步骤骤步骤2:选择检验统计量选择检验统计量 这里这里0是定值,是定值,n为样本容量,为样本容量,X与与S是两个随是两个随机变量,表示样本机变量,表示样本x1,x2,xn的均值与标准的均值与标准差,差,t(n-1)是自由度为是自由度为n-1的的t分布。
分布单样本单样本T T检验检验步骤步骤3 3:给出检验中的显著性水平:给出检验中的显著性水平常取常取=0.05=0.05,根据问题的具体情况,也可取,根据问题的具体情况,也可取= 0.01= 0.01或或0.100.10步骤步骤4 4:给出临界值、确定拒绝域:给出临界值、确定拒绝域根据选择的检验统计量的分布,以及给定的显根据选择的检验统计量的分布,以及给定的显著性水平著性水平,可确定临界值和拒绝域,但在不,可确定临界值和拒绝域,但在不同的三类假设下,拒绝域是不同的同的三类假设下,拒绝域是不同的单样本单样本T T检验检验步骤步骤5 5:根据样本观察值,计算检验统计量的值,:根据样本观察值,计算检验统计量的值,并作判断并作判断判断方法:判断方法:(1 1)若检验统计量的值落在拒绝域中,则拒)若检验统计量的值落在拒绝域中,则拒绝原假设绝原假设2 2)由检验统计量计算)由检验统计量计算P P值,当值,当PP功效和样本数量功效和样本数量1t单样本单样本单样本单样本T T检验检验单样本单样本 t t 检验检验检验平均值检验平均值 = = 零(与零(与 零)零)计算功效的平均值计算功效的平均值 = = 零零 + + 差值差值Alpha = 0.05 Alpha = 0.05 假定标准差假定标准差 = 0.137 = 0.137 样本样本 差值差值 数量数量 目标功效目标功效 实际功效实际功效0.087 29 0.95 0.9545390.087 29 0.95 0.9545390.087 23 0.90 0.9040480.087 23 0.90 0.9040480.087 17 0.80 0.8051850.087 17 0.80 0.805185单样本单样本T T检验检验3、正态性检验、正态性检验单样本单样本T T检验检验进行进行T检验检验单样本单样本T T检验检验单样本单样本 T: T: 面粉重量面粉重量 平均值平均值变量变量 N N 平均值平均值 标准差标准差 标准误标准误 95% 95% 置信区间置信区间面粉重量面粉重量 30 20.0870 0.1371 0.0250 (20.0358, 20.1382) 30 20.0870 0.1371 0.0250 (20.0358, 20.1382) 单样本单样本 T: T: 面粉重量面粉重量 mu = 20 mu = 20 与与 20 20 的检验的检验 平均值平均值变量变量 N N 平均值平均值 标准差标准差 标准误标准误 95% 95% 置信区间置信区间 T P T P面粉重量面粉重量 30 20.0870 0.1371 0.0250 (20.0358, 20.1382) 3.47 0.002 30 20.0870 0.1371 0.0250 (20.0358, 20.1382) 3.47 0.002统计结论:统计结论:P=0.0020.05则拒绝则拒绝H0业务结论:面粉平均重量已有显著变化,生产不正常业务结论:面粉平均重量已有显著变化,生产不正常单样本单样本T T检验检验MINITAB还给出非常直观的图形帮助判断,当还给出非常直观的图形帮助判断,当H0所对应的均值未落入均值的置信区间时,拒绝原假所对应的均值未落入均值的置信区间时,拒绝原假设。
本例设本例H0未落入置信区间,即面粉重量与未落入置信区间,即面粉重量与20kg有显著差别,生产不正常有显著差别,生产不正常某车间所加工的轴棒要求平均长度为某车间所加工的轴棒要求平均长度为500mm,检验员对,检验员对生产轴棒随机抽取了生产轴棒随机抽取了25根,测量结果得样本均值根,测量结果得样本均值501mm样本标准差为样本标准差为1mm问:在显著性水平问:在显著性水平=0.05=0.05下,这下,这批轴棒长度均值能认为是批轴棒长度均值能认为是500mm500mm吗?吗?单样本单样本T T检验检验建立假设建立假设H0:=500 H1: 500由于是小样本,并且由于是小样本,并且未知,选用单样本未知,选用单样本T T检验检验单样本单样本T T检验检验单样本单样本 T mu = 500 与 500 的检验 平均值 N 平均值 标准差 标准误 95% 置信区间 T P25 501.000 1.000 0.200 (500.587, 501.413) 5.00 0.000P=0.0002单边假设检验 H0: 12, H1: 12H1:1211、22分别代表空气和纯氧条件下的分别代表空气和纯氧条件下的BODBOD含量含量双样本双样本T T检验检验2、计算样本量、计算样本量统计统计功效和样本数量功效和样本数量2t单样本单样本双样本双样本 t 检验检验检验平均值检验平均值 1 = 平均值平均值 2(与(与 )计算平均值计算平均值 1 的功效的功效 = 平均值平均值 2 + 差值差值Alpha = 0.05 假定标准差假定标准差 = 12.94 样本样本差值差值 数量数量 目标功效目标功效 实际功效实际功效17.1 16 0.95 0.95110217.1 14 0.90 0.91992317.1 11 0.80 0.838288样本数量是指每个组的。
样本数量是指每个组的双样本双样本T T检验检验3、正态性检验、正态性检验统计统计基本统计量基本统计量正态性检验正态性检验 或或“图形图形概率图概率图”双样本双样本T T检验检验4、方差齐性检验、方差齐性检验HO: H1: 双样本双样本T T检验检验等方差检验等方差检验: 空气空气, 氧气氧气 N 下限下限 标准差标准差 上限上限空气空气 20 11.2178 15.3118 23.7225氧气氧气 20 8.4788 11.5731 17.9302F 检验(正态分布)检验(正态分布)检验统计量检验统计量 = 1.75, p 值值 = 0.231Levene 检验(任何连续分布)检验(任何连续分布)检验统计量检验统计量 = 0.99, p 值值 = 0.327结论:两正态总体的方差在结论:两正态总体的方差在显著性水平显著性水平=0.05=0.05下无显著差异下无显著差异5、检验、检验双样本双样本T T检验检验双样本双样本T T检验检验双样本双样本 T 检验和置信区间检验和置信区间: 空气空气, 氧气氧气 空气空气 与与 氧气氧气 的双样本的双样本 T 平均值平均值 N 平均值平均值 标准差标准差 标准误标准误空气空气 20 188.8 15.3 3.4氧气氧气 20 171.6 11.6 2.6差值差值 = mu (空气空气) - mu (氧气氧气)差值估计差值估计: 17.25差值的差值的 95% 置信下限置信下限: 10.01差值差值 = 0 (与与 ) 的的 T 检验检验: T 值值 = 4.02 P 值值 = 0.000 自由度自由度 = 38两者都使用合并标准差两者都使用合并标准差 = 13.5718统计结。