《参数估计和假设检验2ppt课件》由会员分享,可在线阅读,更多相关《参数估计和假设检验2ppt课件(93页珍藏版)》请在金锄头文库上搜索。
1、参数估计与假设检验参数估计与假设检验4.1参数估计4.2假设检验4.1 参数估计参数估计l4.1.1参数估计的根本概念l4.1.2总体均值和比例的区间估计l4.1.3必要样本容量确实定4.1.1 参数估参数估计的根本概念的根本概念总体样样本本算术平均数算术平均数统计量统计量用来推断总体参数的统计量称为估计量用来推断总体参数的统计量称为估计量estimator), 其取值称为其取值称为估计值估计值estimate) 。 同一个参数可以有多个不同的估计量。参同一个参数可以有多个不同的估计量。参数是独一的,但估计量统计量是随机变量,取值是不确定数是独一的,但估计量统计量是随机变量,取值是不确定的。的
2、。 参数参数点估计l点估计: 用估计量的数值作为总体参数的估计值。l一个总体参数的估计量可以有多个 。例如,在估计总体方差时,l 和l 都可以作为估计量。点估计量的常用评价准那么:无偏性l无偏性:估计量的数学期望与总体待估参数的真值相等:P( )P( )B BA A无偏无偏无偏无偏有偏有偏点估计量的常用评价准那么: 有效性l 在两个无偏估计量中方差较小的估计量较为有效。AB 的抽样分布的抽样分布 的抽样分布的抽样分布P( )P( )估计量的常用评价准那么:一致性l指随着样本容量的增大,估计量越来越接近被估计的总体参数。AB较小的样本容量较小的样本容量较大的样本容量较大的样本容量P(X )X X
3、区间估计l根据事先确定的置信度1 - 给出总体参数的一个估计范围。l置信度1 - 的含义是:在同样的方法得到的一切置信区间中,有100(1- )% 的区间包含总体参数。 l抽样分布是区间估计的实际根底。估计值估计值(点估计点估计)置信下限置信下限置信上限置信上限置信区间置信区间抽样分布 Sampling Distributionl从总体中抽取一个样本量为n的随机样本,我们可以计算出统计量的一个值。l假设从总体中反复抽取样本量为n的样本,就可以得到统计量的多个值。l统计量的抽样分布就是这一统计量一切能够值的概率分布。抽样分布:几个要点l抽样分布是统计量的分布而不是总体或样本的分布。l在统计推断中
4、总体的分布普通是未知的,不可观测的经常被假设为正态分布。l样本数据的统计分布是可以直接观测的,最直观的方式是直方图,可以用来对总体分布进展检验。l抽样分布普通利用概率统计的实际推导得出,在运用中也是不能直接观测的。其外形和参数能够完全不同于总体或样本数据的分布。抽样分布的一个演示:反复抽样抽样分布的一个演示:反复抽样时样本均值的抽样分布时样本均值的抽样分布1设设一一个个总总体体含含有有4 个个个个体体,分分别别为为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下。总体的均值、方差及分布如下。均值和方差均值和方差总体的频数分布总体的频数分布1 14 42 23 30 0.1
5、.1.2.2.3.3抽样分布的一个演示:反复抽样抽样分布的一个演示:反复抽样时样本均值的抽样分布时样本均值的抽样分布2 现现从从总总体体中中抽抽取取n n2 2的的简简单单随随机机样样本本,在在反反复复抽抽样样条条件件下下,共共有有42=1642=16个个样样本本。一一切切样样本本的的结结果果如下表如下表. .3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个察看值第一个察看值一切能够的n = 2 的样本共16个抽样分布的一个演示:反复抽抽样分布的一个演示:反复抽样时样本均值的抽样分布样时样本均值的抽样分布3 各样本的均值如下
6、表,并给出样本均值的抽样各样本的均值如下表,并给出样本均值的抽样分布分布x x样本均值的抽样分布样本均值的抽样分布1.01.00 0.1.1.2.2.3.3P ( x )1.51.53.03.04.04.03.53.52.02.02.52.53.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个察看值第一个察看值16个样本的均值x一切样本均值的均值和方差一切样本均值的均值和方差1. 样本均本均值的均的均值数学期望等于数学期望等于总体均体均值2. 样本均本均值的方差等于的方差等于总体方差的体方差的1/nM为样本数目为样本数目样本均值
7、的抽样分布与总体分布的比较 = 2.5 2 =1.25总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 0.1.1.2.2.3.3P ( x )P ( x )1.51.53.03.04.04.03.53.52.02.02.52.5样本均值的抽样分布样本均值的抽样分布 = 50 = 50 =10 =10X X总体分布总体分布n = 4抽样分布抽样分布Xn =16 普普通通的的,当当总体体服服从从 N(,2 N(,2 ) )时,来来自自该总体体的的容容量量为n n的的样本本的的均均值X X也也服服从从正正态分分
8、布布,X X 的期望的期望为,方差,方差为2/n2/n。即。即X XN(,2/n)N(,2/n)。f(X)f(X)X X小样本小样本中心极限定理中心极限定理从从均均值为,方方差差为 2 2的的一一个个恣恣意意总体体中中抽抽取取容容量量为n n的的样本本,当当n n充充分分大大时,样本本均均值的的抽抽样分分布布近近似服从均似服从均值为、方差、方差为2/n2/n的正的正态分布。分布。大样本大样本大样本大样本(n (n 30) 30)规范误规范误Standard Errorl简单随机抽样、反复抽样时,样本均值抽样分布的规范差等于 ,这l个目的在统计上称为规范误。l统计软件在对变量进展描画统计时普通会
9、输出这一结果。有限总体校正系数Finite Population Correction Factorl简单随机抽样、不反复抽样时,样本均值抽样分布的方差略小于反复抽样的方差,等于l 这一系数称为有限总体校正系数。l当抽样比n/N描画统计描画统计-探求探求统计量规范误均值27.191.8373均值的 95% 置信区间下限25.530上限28.8525% 修整均值26.977中值26.500方差70.104规范差8.3728极小值9.5极大值50.3总体比例的置信区间:例子总体比例的置信区间:例子解:解:显然有然有因此可以用正因此可以用正态分布分布进展估展估计。/2=1.645结论:我们有90的把
10、握以为悉尼青少年中每天都抽烟的青少年比例在19.55%23.85%之间。19861986年年对悉尼悉尼995995名青少年的名青少年的随机随机调查发现,有有216216人每天都人每天都抽烟。抽烟。试估估计悉悉尼青少年中每天尼青少年中每天都抽烟的青少年都抽烟的青少年比例的比例的90%90%的置的置信区信区间。SPSS的计算结果的计算结果l在SPSS中将“能否吸烟输入为取值为1和0的属性变量,权数分别为216和779。计算这一变量均值的置信区间即为比例的置信区间。统计量规范误均值.2171.01308均值的 90% 置信区间下限.1956上限.23865% 修整均值.1857中值.0000方差.1
11、70规范差.41247极小值.00极大值1.00范围1.00四分位距.004.3 必要样本量的计算 样本量越大抽样误差越小。由于调查本钱方面的缘由,在调查中我们总是希望抽取满足误差要求的最小的样本量。关于抽样误差的几个概念l实践抽样误差l抽样平均误差l最大允许误差实践抽样误差l样本估计值与总体真实值之间的绝对离差称为实践抽样误差。l由于在实际中总体参数的真实值是未知的,因此实践抽样误差是不可知的;l由于样本估计值随样本而变化,因此实践抽样误差是一个随机变量。抽样平均误差抽样平均误差l抽样平均误差:样本均值的规范差,也就是前面说的规范误。它反映样本均值或比例与总体均值比例的平均差别程度。l例如对
12、简单随机抽样中的样本均值有:l 或 不反复抽样l我们通常说“抽样调查中可以对抽样误差进展控制,就是指的抽样平均误差。由上面的公式可知影响抽样误差的要素包括:总体内部的差别程度;样本容量的大小;抽样的方式方法。最大允许误差l最大允许误差allowable error):在确定置信区间时样本均值或样本比例加减的量,普通用E来表示,等于置信区间长度的一半。在英文文献中也称为margin of error。l置信区间=l最大允许误差是人为确定的,是调查者在相应的置信度下可以容忍的误差程度。如何确定必要样本量?l必要样本量受以下几个要素的影响:l1、总体规范差。总体的变异程度越大,必要样本量也就越大。l
13、2、最大允许误差。最大允许误差越大,需求的样本量越小。l3、置信度1- 。要求的置信度越高,需求的样本量越大。l4、抽样方式 。其它条件一样,在反复抽样、不反复抽样;简单随机抽样与分层抽样等不同抽样方式下要求的必要样本容量也不同。简单随机抽样下估计总体均值时样本容量确实定l式中的总体方差可以经过以下方式估计:l根据历史资料确定l经过实验性调查估计简单随机抽样下估计总体比例时样本容量确实定l式中的总体比例可以经过以下方式估计:l根据历史资料确定l经过实验性调查估计l取为0.5。不反复抽样时的必要样本量l比反复抽样时的必要样本量要小。l 式中n0是反复抽样时的必要样本容量。样本量确实定实例1需求多
14、大需求多大规模的模的样本才干在本才干在 90% 的置信的置信程度上保程度上保证均均值的的误差在差在 5 之内之内? 前前期研期研讨阐明明总体体规范差范差为 45.nZE=222222(1645) (45)(5)219.2 220.向上取整样本量确实定实例2一一家家市市场调研研公公司司想想估估计某某地地域域有有电脑的的家家庭庭所所占占的的比比例例。该公公司司希希望望对比比例例p的的估估计误差差不不超超越越0.05,要要求求的的可可靠靠程程度度为95%,应抽抽多多大大容容量量的的样本本没没有有可可利利用用的的p估估计值?解 : 知 E=0.05, =0.05,Z/2=1.96,当未知时取为0.5。
15、实例3他在美林证券公司的人力资源部任务。他方案在员工中进展调查以求出他们的平均医疗支出。 他希望有 95% 置信度使得样本均值的误差在$50 以内。 过去的研讨阐明 约为 $400。需求多大的样本容量?nZE=222222(196) (400)(50)24586246.4.2 假设检验假设检验4.2.1 假设检验的根本问题4.2.2 单个总体参数的检验4.2.3 两个总体参数的检验4.2.1 假设检验的根本问题假设检验的根本问题l根本原理l零假设和备择假设l检验统计量和回绝域l两类错误与显著性程度实践中的假设检验问题实践中的假设检验问题l假设检验: 事先作出关于总体参数、分布方式、相互关系等的
16、命题假设,然后经过样本信息来判别该命题能否成立检验 。l产品自动消费线任务能否正常?l某种新消费方法能否会降低产品本钱?l治疗某疾病的新药能否比旧药疗效更高?l厂商声称产质量量符合规范,能否可信?l 案例案例l美国劳工局公布的数字阐明,1998年11月美国的平均失业时间为14.6周。在费城市市长的要求下进展的一项研讨调查了50名失业者,平均失业时间为15.54周。根据调查结果能否以为费城的平均失业时间高于全国平均程度?l澳大利亚统计局公布的2003年第一季度失业率为6.1%。而Roy Morgan公司在调查了14656名14岁以上的居民以后得到的失业率为7.8%。他以为Roy Morgan的结
17、果显著高于统计局的数字吗? 假设检验的根本原理假设检验的根本原理l利用假设检验进展推断的根本原理是:l 小概率事件在一次实验中几乎不会发生。l假设对总体的某种假设是真实的例如学生上课平均出勤率95%,那么不利于或不能支持这一假设的事件A小概率事件,例如样本出勤率=55% 在一次实验中几乎不能够发生的;l要是在一次实验中A竟然发生了样本出勤率=55% ,就有理由疑心该假设的真实性,回绝提出的假设。假设检验的步骤假设检验的步骤l根据实践问题提出一对假设零假设和备择假设;l构造某个适当的检验统计量,并确定其在零假设成立时的分布;l根据观测的样本计算检验统计量的值;l根据犯第一类错误的损失规定显著性程
18、度;l确定决策规那么:根据确定检验统计量的临界值并进而给出回绝域,或者计算p值等;l下结论:根据决策规那么得出回绝或不能回绝零假设的结论。留意“不能回绝零假设不同于“接受零假设。1、零假设和备择假设的选择、零假设和备择假设的选择l零假设和备择假设是互斥的,它们中仅有一个正确;等号必需出如今零假设中;l最常用的有三种情况:双侧检验、左侧检验和右侧检验。l检验以“假定零假设为真开场,假设得到矛盾阐明备择假设正确。双侧检验 左侧检验 右侧检验H0m = m0m m0m m0H1m m0m m0单侧检验时零假设和备择假设的选择单侧检验时零假设和备择假设的选择l通常把研讨者要证明的假设作为备择假设;l将
19、所作出的声明作为原假设;l把现状Status Quo作为原假设;l把不能随便否认的假设作为原假设;零假设和备择假设:零假设和备择假设:把研讨者要证明的假设作为备择假设把研讨者要证明的假设作为备择假设l某种汽车原来平均每加仑汽油可以行驶24英里。研讨小组提出了一种新工艺来提高每加仑汽油的行驶里程。为了检验新的工艺能否有效需求消费了一些产品进展测试。该测试中的零假设和备择假设该如何选取?l要证明的结论是24,因此零假设和备择假设的选择为: l 24 24零假设和备择假设:检验一种声明能否正确零假设和备择假设:检验一种声明能否正确l某种减肥产品的广告中声称运用其产品平均每周可减轻体重8公斤以上。要检
20、验这种声明能否正确他会如何设定零假设和备择假设?l没有充分的证据不能随便否认厂家的声明,因此普通将所作出的声明作为原假设。l零假设和备择假设的普通选择为:l 8 Z /2时回绝零假设,否那么不能回绝零假设。l本例中统计量的观测值等于1.976,因此结论是回绝零假设,以为平均抗拉力有显著变化。统计量的观测值等于1.976H0 = 0 = 0H1m m 0p值也称为观测到的显著性程度, 是能回绝H0 的的最小值,2根据根据p值进展假设检验:双侧检验值进展假设检验:双侧检验 /2回绝回绝01.96-1.96Z1/2 p-值1/2 p-值1.976-1.976 决策规那么: p值 t 时回绝零假设,否
21、那么不能回绝零假设。l本例中统计量的观测值等于2.94,回绝零假设。H0m m0H1 0 01根据根据z值或值或t值进展右侧检验值进展右侧检验2根据根据p值进展假设检验:右侧检验值进展假设检验:右侧检验0t回绝p-值2.94 决策规那么: p值 时 回绝 H0。 例中p值等于0.01083 (Excel计算。 t 左侧检验问题左侧检验问题l一家公司付给消费一线雇员的平均工资是每小时20.0元。公司最近预备选一个新的城市建子公司,备选的城市有几个,能获得每小时工资低于20.0元的劳动力是公司选择城市的主要要素。从备选的某城市抽取40名工人,样本数据的结果是:平均工资是每小时19.0元,样本规范差
22、是2.4元。请在0.10的显著性程度下分析样本数据能否阐明该城市工人的平均每小时工资显著低于20.0元。3、左侧检验问题、左侧检验问题l解:l根据题意由于是大样本,此题也可以用Z统计量近似计算,l观测到的统计量的值等于0 0-t Z, tZ, t回绝域接受域1 - 1 - 统计量的观测值等于-2.64l决策规那么:t ob-t 时回绝零假设,否那么不能回绝零假设。l本例中统计量的观测值等于-2.64。H0m m0H1m m 01根据根据z值或值或t值进展左侧检验值进展左侧检验2根据根据p值进展左侧检验值进展左侧检验0 0t t回绝p-值-2.64-2.64 决策规那么: p值 时 回绝 H0。
23、 本例中p值等于0.00593 (Excel计算。 t 4 总体比例的检验总体比例的检验 l构造检验统计量(np0 5,n(1-p0) 5)l决策规那么:同均值的决策规那么,可以运用Z值、p值或置信区间进展双侧、左侧或右侧检验。案例案例l澳大利亚统计局公布的2003年第一季度失业率为6.1%。而Roy Morgan公司在调查了14656名14岁以上的居民以后得到的失业率为7.8%。他以为Roy Morgan的结果显著高于统计局的数字吗?a=0.01.右侧检验右侧检验l解:l根据题意,显然有np0 5,n(1-p0) 5.l观测到的z统计量的值等于l检验的结论是回绝零假设。案例案例l美国劳工局公
24、布的数字阐明,1998年11月美国的平均失业时间为14.6周。在费城市市长的要求下进展的一项研讨调查了50名失业者。根据调查结果能否以为费城的平均失业时间高于全国平均程度? =0.05。用SPSS Statistics求解【数据文件:失业时间.xls】描画统计结果描画统计结果(SPSS Statistics)假设检验结果假设检验结果(SPSS Statistics)单个样本检验单个样本检验检验值 = 14.6 tdfSig.(双侧)均值差值差分的 95% 置信区间下限上限weeks.67049.506.940 -1.883.76双侧检验的p值。假设需求做单侧检验,相应的p值普通等这一数值除以2
25、。这里做右侧检验,p值等于0.253,因此不能回绝原假设。4.2.3 两个总体均值差别的假设两个总体均值差别的假设检验检验 l1、独立样本的假设检验l2、两个匹配样本的假设检验1、两个独立样本的假设检验、两个独立样本的假设检验l与一个总体的情况类似,两个总体均值假设检验中的备择假设普通有以下三种情况:两个总体均值的比较:检验统计量的选择两个总体均值的比较:检验统计量的选择总体正体正态?大大样本?本?方差知?方差知?否否是是是是否否否否是是增大增大n; 数学数学变换等。等。方差相等?方差相等?否否是是两个总体均值的比较两个总体均值的比较l在运用中能够需根据样本数据对总体的正态性进展检验。非参数检
26、验一章讲解l在实践运用中,总体方差普通是未知的,因此统计软件中普遍运用t检验。l两个总体方差相等和不相等时,t统计量的计算公式不同。因此,检验两个总体的均值能否相等时,需求先检验两个总体的方差能否相等!1两个总体方差能否相等的检验两个总体方差能否相等的检验l在SPSS Statistics 中,检验两个总体均值能否相等时,会同时检验两个总体的方差能否相等。lSPSS Statistics 运用的是Levene 检验。l根据F 统计量相应的p值进展决策:p0.05,因此检验的结论是不能回绝原假设。小结小结1l1根据根据总体能否正体能否正态、总体方差能否知和体方差能否知和样本本容量的大小,容量的大小,计算算总体均体均值的置信区的置信区间有不同的公有不同的公式。最常用的公式式。最常用的公式为l2在在 时总体比例的置信体比例的置信区区间为l3必要必要样本容量的本容量的计算公式:算公式:小结小结2l了解假设检验的小概率原那么l掌握确定零假设的方法l掌握一个总体均值和比例的检验方法l掌握两个总体均值的检验方法独立样本和匹配样本l了解假设检验中p值及计算方法l了解用SPSS Statistics进展假设检验的操作方法,熟习 SPSS的输出结果。