excel均数差异显著性检验

资源描述

《excel均数差异显著性检验》由会员分享，可在线阅读，更多相关《excel均数差异显著性检验（71页珍藏版）》请在金锄头文库上搜索。

1、第四章均数差异显著性检验 t检验,河南农业职业学院孙攀峰,目的要求,显著性检验的目的、方法以及步骤 Excel进行t检验的步骤、方法,第一节概率及分布概述,一、事件,定义：在一定条件下，某种事物出现与否就称为是事件。自然界和社会生活上发生的现象是各种各样的，常见的有两类。,在一定条件下必然出现某种结果或必然不出现某种结果。,确定性事件,必然事件（U) (certain event),不可能事件（V) (impossible event),一、概率基本概念,在一定条件下可能发生也可能不发生。,随机事件(random event) 不确定事件(indefinite event),为了

2、研究随机现象，需要进行大量重复的调查、实验、测试等，这些统称为试验。,二、频率（frequency）,若在相同的条件下，进行了n次试验，在这n次试验中，事件A出现的次数m称为事件A出现的频数，比值m/n称为事件A出现的频率(frequency)，记为W(A)=m/n。,0W(A) 1,抛掷一枚硬币发生正面朝上的试验记录,从表中可以看出，试验随着n值的不同，正面朝上出现的频率也不相同，当n越大时，频率越接近0.50。,一、概率基本概念,频率表明了事件频繁出现的程度，因而其稳定性说明了随机事件发生的可能性大小，是其本身固有的客观属性，提示了隐藏在随机现象中的规律性。,概率,定义：设在相同的条件下

3、，进行大量重复试验，若事件A的频率稳定地在某一确定值p的附近摆动，则称p为事件A出现的概率。,P(A) = p,统计概率,抛掷一枚硬币发生正面朝上的试验记录实验者投掷次数发生正面朝上的次数频率(m/n) 蒲丰 4040 2048 0.5069 K 皮尔逊 12000 6019 0.5016 K 皮尔逊 24000 12012 0.5005,随着实验次数的增多，正面朝上这个事件发生的频率稳定接近0.5，我们称0.5作为这个事件的概率。,三、概率（probability,P),P(A) = p=lim ,在一般情况下，随机事件的概率P是不可能准确得到的。通常以试验次数n充分大，随机事件A的

4、频率作为该随机事件概率的近似值。,m n,m n,1,2,3,4,5,6,7,8,9,10,随机抽取一个球，求下列事件的概率; （1)事件A抽得一个编号 4 （2)事件B =抽得一个编号是2的倍数,该试验样本空间由10个等可能的基本事件构成，即n=10，而事件A所包含的基本事件有3个，即抽得编号为1、2、3中的任何一个，事件A便发生。,P(A)=3/10=0.3,P(B)=5/10=0.5,一、概率基本概念,1,2,3,4,5,6,7,8,9,10,A“一次取一个球，取得红球的概率”,10个球中取一个球，其可能结果有10个基本事件（即每个球被取到的可能性是相等的），即n=10,事件A：取得红球

5、，则A事件包含3个基本事件，即m=3,P(A)=3/10=0.3,四、小概率事件原理,概念：如果某事件发生的概率很小，在大量重复试验中事件发生的频率也很小，在1次试验中该事件被看做是不会发生的。应用：是假设检验时进行统计推断的理论依据。通常将5%，1%认为是小概率的标准，又称显著水平。,第二节均数差异显著性检验,一、复习回顾,生物统计的本质：研究如何从样本推断总体,样本抽取的原则：随机抽样,试验误差的概念：由样本推断总体时，由各种无法控制的随机因素引起的误差。,现在，我们假设有这样一个情况：从一批同质（相同品种、相同日龄、相同饲料、相同饲养管理等）的20000只肉鸡中随

6、机抽取各含100只肉鸡的两个样本，分别称量其42天出栏重，结果发现：样本1平均出栏重为：2.24kg/只样本2平均出栏重为：2.31kg/只,？,两样本来自同一总体，但二者的样本平均数却存在一定差异,这种差异来源于随机抽样造成的随机误差！,现在，我们再来看另一种情况：在相同日龄、相同饲料、相同饲养管理等条件下，随机从两个品种（AA肉鸡、艾维因肉鸡）的各10000只肉鸡中分别抽取100只肉鸡做为样本，称量其42天出栏重，结果发现： AA 肉鸡平均出栏重为：2.31kg/只艾维因肉鸡平均出栏重为：2.24kg/只,？,在试验进行过程中，尽管尽量排除随机误差的影响，以突出试验的处理效应，

7、但由于生物个体间无法避免的差异，以及诸多无法控制的随机因素，使得试验结果最后表现的观察值除了处理效应以外，还包括试验误差的效应。,处理效应,误差效应,表面效应,二、显著性检验的目的,对两个样本进行比较时，必须判断样本间差异主要是随机误差造成的，还是本质不同或处理效应引起的？,处理效应,误差效应,表面效应,处理效应,误差效应,显著性检验,显著性检验,分析误差产生的原因,确定差异的性质,排除误差干扰,对总体特征做出正确判断,三、显著性检验的任务,四、显著性检验的原理,小概率原理：统计假设：对总体的某些未知或不完全知道的性质提出待考查的命题，通常包括无效假设和备择假设。根

8、据样本资料对假设的成立与否进行推断就是假设检验，也称显著性检验。,五、显著性检验的分类,t 检验主要用于检验两个处理平均数差异是否显著；方差分析主要用于检验多个处理平均数间差异是否显著；检验主要用于由质量性状得来的次数资料的显著性检验等。,六、显著性检验的步骤,1、提出假设 2、确定显著水平 3、选定检验方法，计算检验统计量，确定概率值作出推断 4、结论：是否接受假设,例1：随机抽测9头内和9头荣昌猪经产母猪的产仔数，得到如下数据资料：试比较内与荣昌猪两品种经产母猪产仔数是否存在显著差异。,下面以两均数差异显著性检验为例具体说明操作步骤。,1 、提出假设,对立,无效假设 /零假设

9、 /检验假设,备择假设 /对应假设,1 2,1 2,误差效应,处理效应,H0,HA,提出假设：（1）无效假设H0： 1 2 即假设两品种经产母猪产仔数的总体平均数相等，试验的处理效应（品种间差异）为0。（2）备择假设HA ： 1 2 即假设两品种经产母猪产仔数的总体平均数1 和2 不相等，亦即存在处理效应，其意义是指两品种经产母猪产仔数存在本质上的差异。,例：比较内与荣昌猪两品种经产母猪产仔数是否存在显著差异。,2 、确定显著水平,0.05,显著水平*,极显著水平*,能否定H0的人为规定的概率标准称为显著水平，记作。,统计学中，一般认为概率小于0.05或0.01的事件为小概率事件,

10、所以在小概率原理基础上建立的假设检验也常取=0.05和=0.01两个显著水平。,P ,0.01,0.05,3 、选定检验方法，计算检验统计量，确定概率值,根据研究设计的类型和统计推断的目的选择使用不同的检验方法。,例：,这里是对两品种经产母猪产仔数的总体平均数进行比较，因此为均数差异显著性检验-t检验。,在无效假设H0成立的前提下计算t值,注：由于计算过程复杂，这里不再重复书上内容，在下面将具体讲解如何用Excel来进行统计分析。,Excel进行t检验分类,Excel可提供的t检验工具： t-检验：双样本等方差假设此 t-检验先假设两个数据集取自具有相同方差的分布，可确定两个样本是否来自具

11、有相同总体平均值的分布。 t-检验：双样本异方差假设此 t-检验先假设两个数据集取自具有不同方差的分布，可以确定两个样本是否来自具有相同总体平均值的分布。当两个样本中有截然不同的对象时，可使用此检验。 t-检验：平均值的成对二样本分析当样本中存在自然配对的观察值时（例如，对一个样本组在实验前后进行了两次检验），可以使用此成对检验，以确定取自处理前后的观察值是否来自具有相同总体平均值的分布。,Excel进行t检验步骤（一）,输入数据,Excel进行t检验步骤（二）,“工具” “数据分析” “t检验”,这里假设无效假设Ho成立，即两品种无差异，二者来自同一总体，则为“双样本等方差假设”。,Ex

12、cel进行t检验步骤（三）,拉取两品种数据,假设Ho成立，则平均差为0.,“内”“荣昌猪”做为标志拉取在上面的变量区域中,显著水平,结果输出区域，可选任一空白单元格,Excel进行t检验步骤（四）,双尾概率P,计算所得t值,4、作出推断结论：是否接受假设,P,P ,小概率原理,接受H0 否定HA,否定H0 接受HA,假设H0成立可能正确,假设H0成立可能错误,例：上例中 P0.0530.05 所以接受H0，从而得出结论：内与荣昌猪经产母猪产仔数未发现有显著差异，其表面差异应有大于5%的概率归于随机误差所致。,分析题意,提出假设,确定显著水平,计算检验统

13、计量,作出推断,假设检验的步骤:,第一类错误（type I error），又称弃真错误或错误; 第二类错误（ type II error ），又称纳伪错误或错误,七、显著性检验两种类型错误,、两类错误既有联系又有区别,错误只在否定H0时发生错误只在接受H0时发生,错误增加错误减小错误增加错误减小,2、还依赖于 - 0 的距离,3、n , 2 可使两类错误的概率都减小.,八、样本均数与总体均数差异显著性检验,无效假设为Ho：o 备择假设为HA：o 计算公式如下：,根据以上公式可导出以下结论：,由此可知，当总体平均数落在已知的样本均数置信概率为（1-）的置信区间以外时，

14、就表明在显著水平时差异显著。,样本均数与总体均数差异显著性检验t检验,例5.2：母猪的怀孕期为114d，现抽测12头大白猪母猪的怀孕期分别为115，113，114，112，116，115，114，118，113、115、114、113，试检验所得样本的平均数与总体平均数114d有无显著差异？,第一步，输入数据,第二步，工具-数据分析-描述统计,第三步，输入参数,第四步，计算结果,95%置信区间下限：114.3333-1.025696=113.3 上限：114.3333+1.025696=115.4 总体平均数： 114d 分析：总体平均数落在样本均数置信概率为95%的置信区间内（113.3

15、115.4），说明样本均数与总体均数差异不显著。,九、两个样本平均数的差异显著性检验,成组数据平均数的比较,成对数据平均数的比较,试验设计,非配对试验设计,配对试验设计,非配对试验成组数据平均数的比较,试验单位完全随机地分两组，各实施一试验处理，两个样本之间的变量没有任何关联，不论两样本的容量是否相同，所得数据皆为成组数据。两组数据以组平均数作为相互比较的标准，来检验其差异的显著性。如：随机抽测9头内和9头荣昌猪经产母猪的产仔数：内：14，15，12，11，13，17，14，14，13 荣昌猪：12，14，13，13，12，14，10，10，20 分析：这里两品种猪的产仔数无任何关联，每种猪的产仔数分别组成一组数据，相互比较时以组平均数做为比较标准，在Excel里进行t检验时应采用“t检验-双样本等方差假设”或“t检验-双样本异方差假设”进行分析。,配对试验成对数据平均数的比较,试验单位两两配对，随机分配到两个处理，配对的试验单位要求存在相似性，而每个处理内的各试验单位不一定相似，可以变异较大，但配对内试验单位要求相似，因此，两样本容量相同，所得数据为成对数据，两组数据以相配对的试验单位之间的差异作为相互比较的标准，来检验其差异的显著性。在Ex

展开阅读全文