《spss_假设检验幻灯片》由会员分享,可在线阅读,更多相关《spss_假设检验幻灯片(63页珍藏版)》请在金锄头文库上搜索。
1、假设 检验,用SPSS作假设检验,假设检验的一般问题,一个正态总体的参数检验,两个正态总体的参数检验,假设 检验,假设检验中的小概率原理,假设检验的概念,假设检验的步骤,假设检验中的两类错误,双侧检验和单侧检验,假设检验中的P值,假设检验的一般问题,小概率事件在一次试验中几乎不会发生。,(10%,5%,1%),假设检验中的小概率原理,某厂生产一种供出口的罐头,经验表明罐头的净重服从正态分布。标准规格是每罐净重250克,标准差是3克。现从生产线上随机抽取100罐进行检查,称得其平均净重251克。问这批罐头是否合乎规格净重?,假设检验的概念,0,250.6,249.4,样本均值服从均值为250,标
2、准差0.3的正态分布,251,0.9545,假设检验的概念,0,样本均值服从均值为250,标准差0.3的正态分布,2.00,-2.00,3.33,假设检验的概念,0,接受域,拒绝域,拒绝域,临界值,临界值,Z统计量,显著性水平,假设检验是对我们所关心的却又是未知的总体参数先作出假设,然后抽取样本,利用样本提供的信息,根据小概率原理对假设的正确性进行判断的一种统计推断方法。,假设检验的概念,提出原假设和备择假设,某厂生产一种供出口的罐头,经验表明罐头的净重服从正态分布。标准规格是每罐净重250克,标准差是3克。现从生产线上随机抽取100罐进行检查,称得其平均净重251克。问这批罐头是否合乎规格净
3、重?,确定检验统计量,规定显著性水平,显著性水平对应犯拒真错误的概率,通常取=0.05或=0.01或=0.0455,计算检验统计量的值,作出统计决策,拒绝原假设,即这批罐头不符合规格净重。,假设检验的步骤,第一类错误:拒绝了一个本来是真实的原假设。又称拒真错误。,假设检验中我们根据所有可能样本中的一个样本来对假设进行检验。但样本的获得具有随机性,这就使得我们所作出的决策存在着犯错误的可能性 。,原假设为真,原假设为假,第二类错误:接受了一个本来是不真实的原假设。又称采伪错误。,假设检验中四种可能的决策结果,假设检验中的两类错误,拒真错误的概率为/2 + /2 =,正确决策的概率为1-,假设检验
4、中的两类错误,采伪错误的概率为。,正确决策的概率为1-。,假设检验中的两类错误,我们希望犯两类错误的概率越小越好。但两类错误并不是互相独立的。减小 ,将引起的增大;减小 ,又将引起 的增大。要同时减少犯两类错误的概率,唯一的途径是增大样本容量。,假设检验实践中,大家都在执行这样一个原则:把最关心的问题作为原假设提出,从而将后果较严重的错误放在 上,事先加以控制。,假设检验中的两类错误,某公司设计出一种充气包,这种充气包在发生交通事故时对司机可起到缓冲保护作用。该公司宣称其设计的充气包在发生交通事故瞬间只需不超过0.2秒的时间即可充好气而起到缓冲作用。 实践证明,如果其充气时间超过0.2秒,则来
5、不及对司机起到缓冲保护作用而造成伤亡。试对此问题提出合理的原假设 。,假设检验中的两类错误,双侧检验,单侧检验,双侧检验和单侧检验,某厂加工一种零件,根据经验知道,该厂加工的零件的椭圆度渐近服从正态分布,其总体均值为0.081mm,总体标准差为0.025mm。今另换一种新机床进行加工,取200个零件进行检验,得到椭圆度均值为0.076mm。问新机床加工零件的椭圆度总体均值与以前有无显著差别。,双侧检验,接受域,拒绝域,拒绝域,双侧检验,某批发商欲从厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为20小时。在总体中随机抽取了100个灯
6、泡,得其均值为960小时,批发商是否应该购进这批灯泡。,接受域,拒绝域,左侧检验,临界值,单侧检验,电视机显像管批量生产的质量标准为平均使用寿命1200小时,标准差为300小时。某电视机厂宣称其生产的显像管质量大大超过规定标准。为了进行验证,随机抽取100件为样本,测得平均使用寿命为1245小时。能否说该厂的显像管质量显著地高于规定标准,接受域,拒绝域,右侧检验,单侧检验,P 值是当零假设为真时,得到所观测的数据或更极端的数据的概率值。,接受域,拒绝域,拒绝域,假设检验中的P值,对于双侧检验,如果P 值/2,则拒绝H0,P 值可用于与规定的显著性水平比较,进行检验决策,而且提供了样本值在一定范
7、围内出现的概率。,接受域,拒绝域,接受域,拒绝域,对于单侧检验,如果P 值,则拒绝H0,假设检验中的P值,一个正态总体的参数检验,方差已知的均值检验,方差未知的均值检验,总体比率的假设检验,某厂加工一种零件,根据经验知道,该厂加工的零件的椭圆度渐近服从正态分布,其总体均值为0.081mm,总体标准差为0.025mm。今另换一种新机床进行加工,取200个零件进行检验,得到椭圆度均值为0.076mm。问新机床加工零件的椭圆度总体均值与以前有无显著差别。,方差已知的均值检验,接受域,拒绝域,拒绝域,某批发商欲从厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于1000小时。已知灯泡使用寿命服
8、从正态分布,标准差为20小时。在总体中随机抽取了100个灯泡,得其均值为960小时,批发商是否应该购进这批灯泡。,解一:,接受域,拒绝域,方差已知的均值检验,某批发商欲从厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为20小时。在总体中随机抽取了100个灯泡,得其均值为960小时,批发商是否应该购进这批灯泡。,解二:,接受域,拒绝域,方差已知的均值检验,电视机显像管批量生产的质量标准为平均使用寿命1200小时,标准差为300小时。某电视机厂宣称其生产的显像管质量大大超过规定标准。为了进行验证,随机抽取100件为样本,测得平均使用寿命
9、为1245小时。能否说该厂的显像管质量显著地高于规定标准。,解一:,接受域,拒绝域,方差已知的均值检验,电视机显像管批量生产的质量标准为平均使用寿命1200小时,标准差为300小时。某电视机厂宣称其生产的显像管质量大大超过规定标准。为了进行验证,随机抽取100件为样本,测得平均使用寿命为1245小时。能否说该厂的显像管质量显著地高于规定标准。,解二:,接受域,拒绝域,方差已知的均值检验,某机器制造出的肥皂的标准厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.01的显著性水平检验机器性能良好的假设。,接受域,拒绝域,拒绝域,
10、方差未知的均值检验,一个汽车轮胎制造商声称,某一等级轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000km,对一个由120个轮胎组成的随机样本作了试验,测得平均值和标准差分别为41000km和5000km。已知轮胎寿命的公里数近似服从正态分布。能否根据这些数据作出该制造商的产品同他所说的标准相符的结论(=0.05)。,接受域,拒绝域,方差未知的均值检验,一个正态总体均值检验的统计量与拒绝域列表,一个正态总体的参数检验,某高尔夫球场在过去几个月里高尔夫运动者有20%是女性,为增加女性运动者比率,球场以特价方式吸引女性运动者,一周以后,一个400名运动者所组成的样本中,300名为男性,1
11、00名为女性。能否得出结论认为球场的女性运动者比率上升了(=0.05)。,接受域,拒绝域,总体比率的假设检验,两个总体参数之差的抽样分布,两 个 总 体 均值之差的检验,两 个 总 体 比率之差的检验,匹配样本条件下两个总体均值之差的检验,两个正态总体的参数检验,大样本(n130且n230)情形下, 近似服从正态分布,即:,式中:1总体1的标准差 2总体2的标准差 n1来自总体1简单随机样本的的样本容量 n2来自总体2简单随机样本的的样本容量,1 和2已知,两个总体参数之差的抽样分布,两个总体参数之差的抽样分布,式中:s1来自总体1的样本标准差 s2来自总体2的样本标准差 n1来自总体1简单随
12、机样本的的样本容量 n2来自总体2简单随机样本的的样本容量,1 和2未知,大样本(n130且n230)情形下, 近似服从正态分布,即:,两个总体参数之差的抽样分布,小样本情形下,存在自由度为n1+n2-2的t分布,即:,式中:s1来自总体1的样本标准差 s2来自总体2的样本标准差 n1来自总体1简单随机样本的的样本容量 n2来自总体2简单随机样本的的样本容量,1 和2未知, 但已知1 =2,两个总体参数之差的抽样分布,有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8kg,第二种方法的标准差为10kg。从两种方法生产的产品中各抽
13、一个随机样本,样本的容量分别为n1=32,n2=40,测得 =50kg, =44kg。问两种方法生产出来的产品平均抗拉强度是否有显著差别(=0.05)。,两 个 总 体 均值之差的检验,一个车间研究用两种不同的工艺组装某种产品所用的时间是否相同。让一个组的10工人用第一种工艺组装该种产品,平均所需时间为26.1分钟,样本标准差为12分钟。另一组8名工人用第二种工艺组装,平均所需时间为17.6分钟,标准差为10.5分钟。已知用两种工艺组装产品所用时间服从正态分布,且1=2,试问能否认为用第二种方法组装比第一种方法要好。,两 个 总 体 均值之差的检验,大样本情形下,p1-p2近似服从正态分布,即
14、:,p1-p2抽样分布,两 个 总 体 比率之差的检验,对两个大型企业青年工人参加技术培训的情况进行调查,调查结果如下:甲厂:调查60人,18人参加技术培训。乙厂:调查查40人,14人参加技术培训。能否根据以上调查结果认为乙厂工人参加技术培训的人数比例高于甲厂(=0.05)。,两 个 总 体 比率之差的检验,某制造公司有两种方法可供员工执行某生产任务。为使产出最大化,公司试图确认哪种方法有最短完成时间。,抽取样本有两个可供选择的方案,1、独立样本方案:抽取工人的一个简单随机样本,其中每个工人使用方法1;抽取工人的另一个简单随机样本,其中每个工人使用方法2。均值差的检验可采用前述独立样本条件下的
15、检验方法。,2、匹配样本方案:抽取工人的一个简单随机样本,每个工人选用一种方法,后用另一种方法,两种方法的次序是随机排列的;每个工人提供一对数据,一个是方法1的,另一个是方法2的。,匹配样本条件下两个总体均值之差的检验,匹配样本数据,匹配样本方案中,两种生产方法是在相似的条件下被检验的(即由同一个工人执行),所以该方案往往比独立样本方案有更小的抽样误差。这主要是由于匹配样本方案中作为抽样误差来源之一的工人个体间的差异被去掉了。,差值(di)的样本均值与样本标准差,假设差值(di)服从正态分布,则检验统计量,样本数据没有提供足够的证据拒绝H0。,对=0.05,自由度为n-1=5的t分布(t0.025=2.571),双侧检验的拒绝法则为:如果t2.571或t2.571,则拒绝H0。,检验的统计量的值为:,匹配样本条件下两个总体均值之差的检验,结 束,两独立样本T检验,单样本T检验,两配对样本T检验,用SPSS作假设检验,单样本T