excel均数差异显著性检验

上传人:n**** 文档编号:87896128 上传时间:2019-04-14 格式:PPT 页数:71 大小:1.27MB
返回 下载 相关 举报
excel均数差异显著性检验_第1页
第1页 / 共71页
excel均数差异显著性检验_第2页
第2页 / 共71页
excel均数差异显著性检验_第3页
第3页 / 共71页
excel均数差异显著性检验_第4页
第4页 / 共71页
excel均数差异显著性检验_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《excel均数差异显著性检验》由会员分享,可在线阅读,更多相关《excel均数差异显著性检验(71页珍藏版)》请在金锄头文库上搜索。

1、第四章 均数差异显著性检验 t检验,河南农业职业学院 孙攀峰,目 的 要 求,显著性检验的目的、方法以及步骤 Excel进行t检验的步骤、方法,第一节 概率及分布概述,一、事件,定义:在一定条件下,某种事物出现与否就称为是事件。 自然界和社会生活上发生的现象是各种各样的,常见的有两类。,在一定条件下必然出现某种结果或必然不出现某种结果。,确定性事件,必然事件(U) (certain event),不可能事件(V) (impossible event),一、概率基本概念,在一定条件下可能发生也可能不发生。,随机事件(random event) 不确定事件(indefinite event),为了

2、研究随机现象,需要进行大量重复的调查、实验、测试等,这些统称为试验。,二、频率(frequency),若在相同的条件下,进行了n次试验,在这n次试验中,事件A出现的次数m称为事件A出现的频数,比值m/n称为事件A出现的频率(frequency),记为W(A)=m/n。,0W(A) 1,抛掷一枚硬币发生正面朝上的试验记录,从表中可以看出,试验随着n值的不同,正面朝上出现的频率也不相同,当n越大时,频率越接近0.50。,一、概率基本概念,频率表明了事件频繁出现的程度,因而其稳定性说明了随机事件发生的可能性大小,是其本身固有的客观属性,提示了隐藏在随机现象中的规律性。,概 率,定义:设在相同的条件下

3、,进行大量重复试验,若事件A的频率稳定地在某一确定值p的附近摆动,则称p为事件A出现的概率。,P(A) = p,统计概率,抛掷一枚硬币发生正面朝上的试验记录 实验者 投掷次数 发生正面朝上的次数 频率(m/n) 蒲丰 4040 2048 0.5069 K 皮尔逊 12000 6019 0.5016 K 皮尔逊 24000 12012 0.5005,随着实验次数的增多,正面朝上这个事件发生的频率稳定接近0.5,我们称0.5作为这个事件的概率。,三、概率(probability,P),P(A) = p=lim ,在一般情况下,随机事件的概率P是不可能准确得到的。通常以试验次数n充分大,随机事件A的

4、频率作为该随机事件概率的近似值。,m n,m n,1,2,3,4,5,6,7,8,9,10,随机抽取一个球,求下列事件的概率; (1)事件A抽得一个编号 4 (2)事件B =抽得一个编号是2的倍数,该试验样本空间由10个等可能的基本事件构成,即n=10,而事件A所包含的基本事件有3个,即抽得编号为1、2、3中的任何一个,事件A便发生。,P(A)=3/10=0.3,P(B)=5/10=0.5,一、概率基本概念,1,2,3,4,5,6,7,8,9,10,A“一次取一个球,取得红球的概率”,10个球中取一个球,其可能结果有10个基本事件(即每个球被取到的可能性是相等的),即n=10,事件A:取得红球

5、,则A事件包含3个基本事件,即m=3,P(A)=3/10=0.3,四、小概率事件原理,概念: 如果某事件发生的概率很小,在大量 重复试验中事件发生的频率也很小, 在1次试验中该事件被看做是不会发 生的。 应用:是假设检验时进行统计推断的理论依据。 通常将5%,1%认为是小概率的标准,又称 显著水平。,第二节 均数差异显著性检验,一、复习回顾,生物统计的本质: 研究如何从样本推断总体,样本抽取的原则: 随机抽样,试验误差的概念: 由样本推断总体时,由各种无法控制的随机因素引起的误差。,现在,我们假设有这样一个情况: 从一批同质(相同品种、相同日龄、相同饲料、相同饲养管理等)的20000只肉鸡中随

6、机抽取各含100只肉鸡的两个样本,分别称量其42天出栏重,结果发现: 样本1平均出栏重为:2.24kg/只 样本2平均出栏重为:2.31kg/只,?,两样本来自同一总体,但二者 的样本平均数却存在一定差异,这种差异来源于随机抽样 造成的随机误差!,现在,我们再来看另一种情况: 在相同日龄、相同饲料、相同饲养管理等条件下,随机从两个品种(AA肉鸡、艾维因肉鸡)的各10000只肉鸡中分别抽取100只肉鸡做为样本,称量其42天出栏重,结果发现: AA 肉鸡平均出栏重为:2.31kg/只 艾维因肉鸡平均出栏重为:2.24kg/只,?,在试验进行过程中,尽管尽量排除随机误差的影响,以突出试验的处理效应,

7、但由于生物个体间无法避免的差异,以及诸多无法控制的随机因素,使得试验结果最后表现的观察值除了处理效应以外,还包括试验误差的效应。,处理 效应,误差 效应,表 面 效 应,二、显著性检验的目的,对两个样本进行比较时,必须判断样本间差异主要是随机误差造成的,还是本质不 同或处理效应引起的?,处理 效应,误差 效应,表 面 效 应,处理 效应,误差 效应,显著性检验,显著性检验,分析误差产生的原因,确定差异的性质,排除误差干扰,对总体特征做出正确判断,三、显著性检验的任务,四、显著性检验的原理,小概率原理: 统计假设:对总体的某些未知或不完全知道的性质提出待考查的命题,通常包括无效假设和备择假设。根

8、据样本资料对假设的成立与否进行推断就是假设检验,也称显著性检验。,五、显著性检验的分类,t 检验主要用于检验两个处理平均数差异是否显著; 方差分析主要用于检验多个处理平均数间差异是否显著; 检验 主要用于由质量性状得来的次数资料的显著性检验等。,六、显著性检验的步骤,1、提出假设 2、确定显著水平 3、选定检验方法,计算检验统计量, 确定概率值作出推断 4、结论:是否接受假设,例1: 随机抽测9头内和9头荣昌猪经产母猪的产仔数,得到如下数据资料: 试比较内与荣昌猪两品种经产母猪产仔数是否存在显著差异。,下面以两均数差异显著性检验为例具体说明操作步骤。,1 、提出假设,对 立,无效假设 /零假设

9、 /检验假设,备择假设 /对应假设,1 2,1 2,误差 效应,处理 效应,H0,HA,提出假设: (1)无效假设H0: 1 2 即假设两品种经产母猪产仔数的总体平均数相等,试验的处理效应(品种间差异)为0。 (2)备择假设HA : 1 2 即假设两品种经产母猪产仔数的总体平均数1 和2 不相等,亦即存在处理效应,其意义是指两品种经产母猪产仔数存在本质上的差异。,例:比较内与荣昌猪两品种经产母猪产仔数 是否存在显著差异。,2 、 确定显著水平,0.05,显著水平*,极显著水平*,能否定H0的人为规定的概率标准称为显著水平,记作。,统计学中,一般认为概率小于0.05或0.01的事件为小概率事件,

10、所以在小概率原理基础上建立的假设检验也常取=0.05和=0.01两个显著水平 。,P ,0.01,0.05,3 、选定检验方法,计算检验统计量,确定概率值,根据研究设计的类型和统计推断的目的选择使用不同的检验方法。,例:,这里是对两品种经产母猪产仔数的总体平均数进行比较,因此为均数差异显著性检验-t检验。,在无效假设H0成立的前提下计算t值,注:由于计算过程复杂,这里不再重复书上内容,在下面将具体讲解如何用Excel来进行统计分析。,Excel进行t检验分类,Excel可提供的t检验工具: t-检验:双样本等方差假设 此 t-检验先假设两个数据集取自具有相同方差的分布,可确定两个样本是否来自具

11、有相同总体平均值的分布。 t-检验:双样本异方差假设 此 t-检验先假设两个数据集取自具有不同方差的分布,可以确定两个样本是否来自具有相同总体平均值的分布。当两个样本中有截然不同的对象时,可使用此检验。 t-检验:平均值的成对二样本分析 当样本中存在自然配对的观察值时(例如,对一个样本组在实验前后进行了两次检验),可以使用此成对检验,以确定取自处理前后的观察值是否来自具有相同总体平均值的分布。,Excel进行t检验步骤(一),输入数据,Excel进行t检验步骤(二),“工具” “数据分析” “t检验”,这里假设无效假设Ho成立,即两品种无差异,二者来自同一总体,则为“双样本等方差假设”。,Ex

12、cel进行t检验步骤(三),拉取两品种数据,假设Ho成立,则平均差为0.,“内”“荣昌猪”做为标志拉取在上面的变量区域中,显著水平,结果输出区域,可选任一空白单元格,Excel进行t检验步骤(四),双尾概率P,计算所得t值,4、作出推断结论:是否接受假设,P,P ,小 概 率 原 理,接受H0 否定HA,否定H0 接受HA,假设H0成立 可能正确,假设H0成立 可能错误,例:上例中 P0.0530.05 所以接受H0,从而得出结论:内与荣昌猪经产母猪产仔数未发现有显著差异,其表面差异应有大于5%的概率归于随机误差所致。,分 析 题 意,提 出 假 设,确 定 显 著 水 平,计 算 检 验 统

13、 计 量,作 出 推 断,假设检验的步骤:,第一类错误(type I error),又称弃真错误或 错误; 第二类错误( type II error ) ,又称纳伪错误或 错误,七、显著性检验两种类型错误,、 两类错误既有联系又有区别,错误只在否定H0时发生 错误只在接受H0时发生,错误增加 错误减小 错误增加 错误减小,2、 还依赖于 - 0 的距离,3、n , 2 可使两类错误的概率都减小.,八、样本均数与总体均数差异显著性检验,无效假设为Ho:o 备择假设为HA:o 计算公式如下:,根据以上公式可导出以下结论:,由此可知,当总体平均数落在已知的样本均数置信概率为(1-)的置信区间以外时,

14、就表明在显著水平时差异显著。,样本均数与总体均数差异显著性检验t检验,例5.2:母猪的怀孕期为114d,现抽测12头大白猪母猪的怀孕期分别为115,113,114,112,116,115,114,118,113、115、114、113,试检验所得样本的平均数与总体平均数114d有无显著差异?,第一步, 输入数据,第二步,工具-数据分析-描述统计,第三步,输入参数,第四步,计算结果,95%置信区间 下限:114.3333-1.025696=113.3 上限:114.3333+1.025696=115.4 总体平均数: 114d 分析:总体平均数落在样本均数置信概率为95%的置信区间内(113.3

15、115.4),说明样本均数与总体均数差异不显著。,九、两个样本平均数的差异显著性检验,成组数据平均数的比较,成对数据平均数的比较,试 验 设 计,非配对试验设计,配对试验设计,非配对试验成组数据平均数的比较,试验单位完全随机地分两组,各实施一试验处理,两个样本之间的变量没有任何关联,不论两样本的容量是否相同,所得数据皆为成组数据。两组数据以组平均数作为相互比较的标准,来检验其差异的显著性。 如:随机抽测9头内和9头荣昌猪经产母猪的产仔数: 内:14,15,12,11,13,17,14,14,13 荣昌猪:12,14,13,13,12,14,10,10,20 分析:这里两品种猪的产仔数无任何关联,每种猪的产仔数分别组成一组数据,相互比较时以组平均数做为比较标准,在Excel里进行t检验时应采用“t检验-双样本等方差假设”或“t检验-双样本异方差假设”进行分析。,配对试验成对数据平均数的比较,试验单位两两配对,随机分配到两个处理,配对的试验单位要求存在相似性,而每个处理内的各试验单位不一定相似,可以变异较大,但配对内试验单位要求相似,因此,两样本容量相同,所得数据为成对数据,两组数据以相配对的试验单位之间的差异作为相互比较的标准,来检验其差异的显著性。 在Ex

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 职业教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号