差异显著性检验-t检验

资源描述

《差异显著性检验-t检验》由会员分享，可在线阅读，更多相关《差异显著性检验-t检验（68页珍藏版）》请在金锄头文库上搜索。

1、1,第二章差异显著性检验,2,学习前概述,本章学习目的重点与难点学习方法学习内容参考文献课后练习（作业）：tjxyl2011_,3,学习内容提示,一些相关的概念概率反证法（小概率实际不可能原则）显著性检验的意义实例分析（t、检验） Excel数据分析方法,4,具体章节安排,第一节：显著性检验意义第二节：t 检验（Excel）第三节：方差分析（F 检验）（SAS软件学习）第四节：不同专业可能涉及到的具体问题的相关实例分析（案例介绍）,5,第一节显著性检验意义,一、几个相关概念二、两种试验设计方案介绍三、差异显著性检验,6,一、几个相关概念,1. 总体与样本根据研

2、究目的确定的研究对象的全体称为总体(population)；总体中的一个研究单位称为个体(individual)；含有有限个个体的总体称为有限总体；包含有无限多个个体的总体叫无限总体；总体的一部分称为样本(sample)；样本中所包含的个体数目叫样本容量或大小(sample size)；样本容量常记为 n ，通常把n30的样本叫小样本，n 30的样本叫大样本。,7,一、几个相关概念,总体与样本关系：假想总体统计分析的特点随机抽取样本含量与代表性：统计推断或者分析的不确定性,8,一、几个相关概念,2. 参数与统计量参数：由总体计算的特征数叫参数(parameter)；

3、常用希腊字母表示参数，例如用表示总体平均数，用表示总体标准差；统计量：由样本计算的特征数叫统计量(staistic) 常用拉丁字母表示统计量，例如用表示样本平均数，用 s 表示样本标准差。参数与统计量的关系：总体参数由相应的统计量来估计，例如用估计，用 s 估计等。,9,一、几个相关概念,3 误差、错误、系统误差、随机误差,误差: 试验过程中非处理因素造成的观测值(或者试验结果)与真值之间的差异。错误: 指工作人员在试验过程中所犯的错误造成的真值与观测值间的差异。系统误差: 又称为片面误差，由于试验植物土壤动物等的初始条件、药品的品质、仪器的不准等因素引起的真值与观测指间的差异

4、；通过努力可以克服系统误差；随机误差：随机误差又叫抽样误差(sampling error) ，这是由于许多无法控制的内在和外在的偶然因素所造成的真值与观测指间的差异；在试验中，即使十分小心也难以消除；随机误差影响试验的精确性；统计上的试验误差指随机误差，这种误差愈小，试验的精确性愈高。,10,一、几个相关概念,4. 频率与概率频率某一随机事件或者现象出现的次数占总调查次数或者总试验次数的比值概率某一事件发生可能性的定量度量，是我们所观测到的频率的理论次数频率与概率的关系频率相当于统计量，概率相当于参数，概率是频率的稳定值,11,一、几个相关概念,5. 百分比与百分率百分比：是

5、一种结构指标，表示事件占的比例，也就是部分对全部之比百分率是频率指标，表示事件出现的频率。百分比与百分率的关系为两种不同的统计指标。,12,一、几个相关概念,6. 准确性与精确性准确性由准确性(accuracy)也叫准确度，指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。精确性由精确性(precision)也叫精确度，指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。准确性与精确性的关系调查或试验的准确性、精确性合称为正确性；精确性高，准确性不一定高；准确性高，精确性一定高；实际应用中，总体均值常未知，所以准确性不易度量，但利用统计方法可度量精确

6、性。,13,一、几个相关概念,7. 农业和生物学领域的科学研究,14,一、几个相关概念,8. 科学研究的基本方法根据自己的观察(了解)或前人的观察(通过文献)对所研究的命题形成一种认识或假说；根据假说所涉及的内容安排相斥性的试验或抽样调查；根据试验或调查所获的资料进行推理，肯定或否定或修改假说，从而形成结论，或开始新一轮的试验以验证修改完善后的假说，如此循环发展，使所获得的认识或理论逐步发展、深化,15,一、几个相关概念,9. 科学研究的基本过程选题文献假说假说的检验试验的规划与设计,16,一、几个相关概念,10. 试验方案（狭义的概念）根据试验目的和要求所拟进行比较的一

7、组试验处理 (treatment)的总称。例1：研究（某地）研究生入学考试中英语试题是否泄漏？例2：如何在三个不同小麦品种中选择一种在太谷县种植？例3：温度与作物病虫害的关系研究等,17,一、几个相关概念,11. 因素或因子(factor) 被变动并设有待比较的一组处理的因子称为试验因素。例1. 比较三种不同的降压药哪一种对降压效果最好。 A、B、C 例2 . 比较山西农业大学10个专业的就业率高低例3. 不同水分条件玉米的产量情况如何,18,一、几个相关概念,12. 水平(level) 试验因素的量的不同级别或质的不同状态称为水平例1. 比较三种不同的降压药哪一种对降压效果最好。

8、 A、B|、C 例2 . 比较山西农业大学10个专业的就业率高低例3. 不同水分条件玉米的产量情况如何,19,一、几个相关概念,13. 单因素试验指整个试验中只变更、比较一个试验因素的不同水平，其他作为试验条件的因素均严格控制一致的试验。,20,一、几个相关概念,14 多因素试验指在同一试验方案中包含2个或2个以上的试验因素，各个因素都分为不同水平，其他试验条件均应严格控制一致的试验。,21,一、几个相关概念,15 综合性试验综合性试验中各因素的各水平不构成平衡的处理组合，而是将若干因素的某些水平结合在一起形成少数几个处理组合。,22,一、几个相关概念,16. 试验指标与效应 1) 用

9、于衡量试验效果的指示性状称试验指标。 2) 试验因素对试验指标所起的增加或减少的作用称为试验效应。 3) 在同一因素内两种水平间试验指标的差值称简单效应。 4) 一个因素内各简单效应的平均数称平均效应，亦称主要效应，简称主效。 5) 两个因素简单效应间的平均值差异称为交互作用效应，简称互作。,23,实例1 小麦的施肥量试验(N),24,实例1 小麦的施肥量试验(N),试验方案,25,实例 1 小麦的施肥量试验(N),水平,26,实例 1 小麦的施肥量试验(N),试验指标,27,实例1 小麦的施肥量试验(N),试验效应,简单效应,900-700=200,28,实例1 小麦的施肥量试验(N),主效

10、应,(900-700)/2=200/2=100,29,实例2 小麦的施肥量试验(N、P),30,实例2 小麦的施肥量试验(N、P),单因素试验,实例1 小麦的施肥量试验(N),多因素试验,综合试验,N1P2、 N2P2,31,实例2 小麦的施肥量试验(N、P),P的主效应,N的主效应,（500-900）+（800-1200） /2=- 400,（800-500）+（1200-900） /2= 300,32,实例2 小麦的施肥量试验(N、P),两个因素简单效应间的平均值差异称为交互作用效应，简称互作,互作效应,（-400 - -400）/2=0,33,一、几个相关概念,* 17.平均数平均数是

11、统计学中最常用的统计量，用来表明资料中各观测值相对集中较多的中心位置，并且可作为资料的代表而与另一组资料相比较，借以明确二者之间相差(或者差异)的情况。平均数主要包括有：,34,17.平均数,算术平均数（arithmetic mean）中位数（median）众数（mode）几何平均数（geometric mean）调和平均数（harmonic mean）,35,17.平均数,算术平均数算术平均数是指资料中各观测值的总和除以观测值个数所得的商，简称平均数或均数。,样本均值记为:,总体均值记为:,36,17.平均数,算术平均数的计算,若样本较小，即资料包含的观察值个数不多，可直接计算平

12、均数。设一个含有n个观察值的样本，其各个观察值为x1、x2、x3、xn，则算术平均数由下式算得:,37,17.平均数,计算实例1 某种公牛站测得10头成年公牛的体重分别为500、520、535、560、585、600、480、510、505、490（kg），求其平均数,38,17.平均数,加权法计算若干个来自同一总体的样本平均数的平均数时，如果样本含量不等(或者其总要性程度不同)，也采用加权法计算,39,17.平均数,算术平均数的重要特性,样本各观察值与其平均数的差数(简称离均差)的总和等于0,样本各观察值与其平均数的差数平方的总和，较各个观察值与任意其他数值的差数平方的总和为小，即对任意实

13、数 a,均有下式成立，当且仅当a取样本均值时，等号成立,40,17.平均数,总体平均数,41,17.平均数,中位数,将资料内所有观测值从小到大依次排列，位于中间的那个观测值，称为中位数，记为Md。当观测值的个数是偶数时，则以中间两个观测值的平均数作为中位数。当所获得的数据资料呈偏态分布时，中位数的代表性优于算术平均数。,42,17.平均数,众数,资料中出现次数最多的那个观测值或次数最多一组的组中值，称为众数,通过调查发现，50枚受精种蛋出雏天数次数分布中，以22出现的次数最多，则该资料的众数为22天。,43,17.平均数,几何平均数,n 个观测值相乘之积开 n 次方所得的方根，称为几何平均数

14、，记为G。它主要应用于畜牧业、水产业的生产动态分析，畜禽疾病及药物效价的统计分析。如畜禽、水产养殖的增长率，抗体的滴度，药物的效价，畜禽疾病的潜伏期等，用几何平均数比用算术平均数更能代表其平均水平。,44,17.平均数,调和平均数,资料中各观测值倒数的算术平均数的倒数，称为调和平均数，记为H,45,17.平均数,对于同一资料：算术平均数几何平均数调和平均数上述五种平均数，最常用的是算术平均数。,46,18. 标准差,标准差的意义,用平均数作为样本的代表，其代表性的强弱受样本资料中各观测值变异程度的影响。仅用平均数对一个资料的特征作统计描述是不全面的，还需引入一个表示资料中观测值变

15、异程度大小的统计量。,47,18. 标准差,常见的表示观测值变异程度的指标有：全距（极差）、标准差（方差）、变异系数,48,18. 标准差,全距（极差）是表示资料中各观测值变异程度大小最简便的统计量。但是全距只利用了资料中的最大值和最小值，并不能准确表达资料中各观测值的变异程度，比较粗略。当资料很多而又要迅速对资料的变异程度作出判断时，可以利用全距这个统计量。,49,18. 标准差,标准差的意义,为了准确地表示样本内各个观测值的变异程度，人们首先会考虑到以平均数为标准，求出各个观测值与平均数的离差，（），称为离均差。,50,18. 标准差,标准差的意义,虽然离均差能表示一个观测值偏离平均

16、数的性质和程度，但因为离均差有正、有负，离均差之和为零，即：因而不能用离均差之和来表示资料中所有观测值的总偏离程度。,51,18. 标准差,我们还可以采用将离均差平方的办法来解决离均差有正、有负，离均差之和为零的问题。先求各个离均差平方：再求离均差平方和：,52,18. 标准差,为了消除样本大小的影响，用平方和除以样本含量，求出离均差平方和的平均数。,53,18. 标准差,在统计学中，求离均差平方和的平均数时，分母不用样本含量n，而用自由度的df=n-1，于是，我们采用如下公式表示资料的变异程度。,称为均方，又称样本方差，记为S2,54,18. 标准差,相应的总体参数叫总体方差，记为2。对于有限总体而言，2的计算公式为：,因此，求一组数据的均值与方差时，选用的公式与对数据的处理方式有关,55,18. 标准差,由于样本方差带有原观测单位的平方单位，在仅表示一个资料中各观测值的变异程度而不作其它分析时，常需要与平均数配合使用，

展开阅读全文

差异显著性检验-t检验

最新文档