第二章数学基础.ppt－金锄头文库

资源描述

《第二章数学基础.ppt》由会员分享，可在线阅读，更多相关《第二章数学基础.ppt（94页珍藏版）》请在金锄头文库上搜索。

1、第二章实验设计的数学基础简介,第一节统计学基础第二节线性代数基础第三节回归与分析,第一节统计学基础,一、平均数、标准差与变异系数二、显著性检验三、方差分析四、协方差分析,一、平均数、标准差与变异系数,（一）平均数：算术平均数是指资料中各观测值的总和除以观测值个数所得的商，简称平均数或均数，记为。算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。平均数的基本性质:(1)样本各观测值与平均数之差的和为零，即离均差之和等于零。(2)样本各观测值与平均数之差的平方和为最小，即离均差平方和为最小。对于总体而言，通常用表示总体平均数，有限总体的平均数为：式中，N表示总

2、体所包含的个体数。当一个统计量的数学期望等于所估计的总体参数时，则称此统计量为该总体参数的无偏估计量。统计学中常用样本平均数作为总体平均数（）的估计量，并已证明样本平均数是总体平均数的无偏估计量。 1、算术平均数（arithmetic mean）：直接求算法和加权平均值法 2、中位数（median）:将资料内所有观测值从小到大依次排列，位于中间的那个观测值，称为中位数，记为Md。当观测值的个数是偶数时，则以中间两个观测值的平均数作为中位数。中位数简称中数。当所获得的数据资料呈偏态分布时，中位数的代表性优于算术平均数。,3、众数（mode）：出现次数最多的那个观测值或次数最多一组的组中值，

3、称为众数，记为M0。 4、几何平均数（geometric mean）： n个观测值相乘之积开n次方所得的方根，称为几何平均数，记为G。 5、调和平均数（harmonic mean）：各观测值倒数的算术平均数的倒数，称为调和平均数，记为H。,（二）标准差及变异系数,平均值只能反映效应的平均高低，而变异程度是另一个衡量效应的重要指标。极差和离均差不能全面反映变异程度，后者有正负号，离均差之和为0。离均差平方和除以自由度得到均方（mean square缩写为MS）,又称样本方差，记为S2。S2= 相应的总体参数叫总体方差，记为2。对于有限总体而言，统计学上把样本方差S2的平方根叫做样本标准差，

4、记为S ：相应的总体参数叫总体标准差，记为。在统计学中，常用样本标准差S估计总体标准差。在样本服从正态分布的条件下，资料中约有68.26%的观测值在平均数左右一倍标准差（S）范围内；约有95.43%的观测值在平均数左右两倍标准差（2S）范围内；约有99.73%的观测值在平均数左右三倍标准差（3S）范围内。也就是说全距近似地等于6倍标准差,变异系数：变异系数是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时，如果度量单位与平均数相同，可以直接利用标准差来比较。如果单位和（或）平均数不同时，比较其变异程度就不能采用标准差，而需采用标准差与平均数的比值（相对值）来

5、比较。标准差与平均数的比值称为变异系数，记为CV。变异系数可以消除单位和（或）平均数不同对两个或多个资料变异程度比较的影响。变异系数的计算公式为：,二、假设（显著性）检验,对总体分布或分布中的某些参数作出假设，然后利用样本的观测值所提供的信息，检验这种假设是否成立，这一统计推断过程，称为假设检验。（1）待检验假设或零假设记为H0，正在被检验的与相对立的假设H1称为备选假设或对立假设。（2）假设检验的依据小概率原理：小概率事件在一次试验中实际上不会发生。（3）假设检验的思路是概率性质的反证法。即首先假设成立，然后根据一次抽样所得的样本值得信息，若导致小概率事件发生，则拒绝原假设，否则

6、接受原假设。,假设检验的程序及方法,1、假设检验程序根据题意提出零假设H0（或相应备选假设H1）。构造样本统计量并确定其分布；给定显著性水平a，查表确定临界值，从而得出接受域和拒绝域；由样本观测值计算出统计量的值；作出判断：若统计量的值落入拒绝域则拒绝H0，若统计量的值落入接受域则接受H0。 2、假设检验的主要方法有： Z检验法、t检验法、c2检验法、F检验法。,t-检验,以样本平均数作为检验对象，由两个样本平均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。（一）t-检验的基本步骤： 1）首先对试验样本所在的总体作假设，无效假设（null hypothesis）, 记作

7、H0：m1=m2或m1-m2 =0。无效假设是被检验的假设，通过检验可能被接受，也可能被否定。否定时可提出备择假设（alternative hypothesis）,记作HA：m1m2或m1-m20； 2）在无效假设成立的前提下，构造合适的统计量，并研究试验所得统计量的抽样分布，计算无效假设正确的概率，继而查表找出其概率。 3）根据“小概率事件实际不可能性原理”否定或接受无效假设，根据这一原理，当试验的表面效应是试验误差的概率小于0.05时，可以认为在一次试验中试验表面效应是试验误差实际上是不可能的，因而否定原先所作的无效假设： m1=m2 ，接受备择假设：m1 m2 ，即认为：试验的处理

8、效应是存在的。,在t-检验中，备择假设包括了 m1 或 m2两种可能。双侧t-检验：在水平上否定域为和，对称地分配在t分布曲线的两侧尾部，每侧的概率为a /2，这种利用两尾概率进行的检验叫双侧检验（two-sided test），也叫双尾检验（two-tailed test）, 为双侧检验的临界t值。单侧t-检验：这种利用一侧概率进行的检验叫单侧检验（one-sided test）也叫单尾检验（one-tailed test）。此时为单侧检验的临界t值。显然，单侧检验的 =双侧检验的。,（二）方差分析,多个平均数的差异显著性检验不宜用t检验，须采用方差分析法。方差分析(ana

9、lysis of variance)是由英国统计学家R.A.Fisher于1923年提出的。这种方法是将k个处理的观测值作为一个整体看待，把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度，进而获得不同变异来源总体方差估计值；通过计算这些总体方差的估计值的适当比值，就能检验各样本所属总体平均数是否相等。方差分析实质上是关于观测值变异原因的数量分析，它在实验设计中应用十分广泛。总体方差与已知值相等的统计检验2 检验法两总体方差的统计检验检验法,方差分析的基本原理与步骤,线性模型与基本假定,设想每一个处理的观察响应值是一个随机变量，m是总均值，ai是第i个处理的唯一的参数（

10、第i个处理效应），ei是随机误差，则：是第i个处理的效应表示处理i对试验结果产生的影响。效应的可加性（additivity）、分布的正态性（normality）、方差的同质性（homogeneity）假设模型误差是独立的正态分布的随机变量，其均值为零，方差为s2,方差分析的基本步骤,（一）计算各项平方和与自由度。（二）列出方差分析表，计算F值，与临界值比较，进行F检验。（三）若F检验显著，则进行多重比较。多重比较的方法有最小显著差数法(LSD法)和最小显著极差法(LSR法：包括q检验法和新复极差法)。表示多重比较结果的方法有三角形法和标记字母法。,例3,为了比较四种不同增溶剂对某药物

11、的增溶效果，对加有四种增溶剂的处方进行了实验,结果如下表。,这是一个单因素试验，处理数k=4，重复数n=5。各项平方和及自由度计算如下：矫正数总平方和处理间平方和处理内平方和总自由度处理间自由度处理内自由度用SSt、SSe分别除以dft和dfe便得到处理间均方MSt及处理内均方Mse F=MSt/MSe=38.09/5.34=7.13*；根据df1=dft=3，df2=dfe=16查F表，得FF0.01(3，16) =5.29,P0.01，表明四种不同增溶剂的效果差异极显著,方差分析表,多重比较,F值显著或极显著，否定了无效假设，表明试验的总变异主要来源于处理间的变异，试验中各

12、处理平均数间存在显著或极显著差异，但并不意味着每两个处理平均数间的差异都显著或极显著，也不能具体说明哪些处理平均数间有显著或极显著差异，哪些差异不显著。有必要进行两两处理平均数间的比较，即多重比较(multiple comparisons)。以具体判断两两处理平均数间的差异显著性多重比较的方法甚多，常用的有最小显著差数法(LSD法),最小显著差数法 (LSD法，least significant difference),此法的基本作法是：在F检验显著的前提下，先计算出显著水平为的最小显著差数，然后将任意两个处理平均数的差数的绝对值与其比较。若LSDa时，则与在水平上差异显著；反之，则在水平

13、上差异不显著。最小显著差数由下式计算。 (1)列出平均数的多重比较表，比较表中各处理按其平均数从大到小自上而下排列； (2)计算最小显著差数和； (3)将平均数多重比较表中两两平均数的差数与、比较，作出统计推断。,例3的LSD法比较,单一自由度的正交比较,事先按照一定的原则设计好(k-1)个正交比较，将处理间平方和根据设计要求剖分成有意义的各具一个自由度的比较项，然后用F检验(此时df1=1)，这就是所谓单一自由度的正交比较(orthogonal comparison of single degree of freedom)，也叫单一自由度的独立比较(independent compariso

14、n of single degree of freedom)。单一自由度的正交比较有成组比较和趋势比较两种情况，后者要涉及到回归分析。,例4,某试验研究不同药物对腹水癌的治疗效果，将患腹水癌的25只小白鼠随机分为5组，每组5只。其中A1组不用药作为对照，A2、A3为用两个不同的中药组，A4、A5为用两个不同的西药组，各组小白鼠的存活天数如下表所示。,这是一个单因素试验，处理数k=4，重复数n=5。各项平方和及自由度计算如下：矫正数总平方和处理间平方和处理内平方和总自由度处理间自由度处理内自由度用SSt、SSe分别除以dft和dfe便得到处理间均方MSt及处理内均方Mse,这是一

15、个单因素试验，其中k=5,n=5，按照前面介绍的方法进行方差分析，可以得到方差分析表，说明组间有显著差异。试验者还想了解：(1)不用药物治疗与用药物治疗；(2)中药与西药；(3)中药A2与中药A3；(4)西药A4与西药A5；相比结果如何?,首先将表中各处理的总存活天数抄于下表，然后写出各预定比较的正交系数Ci(orthogonal coefficient)。各个比较的正交系数确定后，便可获得每一比较的总和数的差数Di，其通式为：进而可求得各比较的平方和SSi，式中的n为各处理的重复数，本例n=5。 SS1+SS2+SS3+SS4正是处理间平方和SSt。这也就是说，利用上面的方法我们已将处理

16、间具4个自由度的平方和再度分解为各具一个自由度的4个正交比较的平方和查F值表，df1=1,df2=20时，F0.05(1,20) =4.35，F0.01(1,20) =8.10。所以，在这一试验的上述4个比较差异都极显著,协方差分析的意义,协方差分析有二个意义，一是对试验进行统计控制，二是对协方差组分进行估计。为了提高试验的精确性和准确性，对处理以外的一切条件都需要采取有效措施严加控制，使它们在各处理间尽量一致，这叫试验控制。但在有些情况下，即使作出很大努力也难以使试验控制达到预期目的。这时可利用x与y的回归关系，将y都矫正为x相同时的值，于是x不同对y的影响就消除了。由于矫正后的y是应用统计方法将初始重控制一致而得到的，故叫统计控制。统计控制是试验控制的一种辅助手段。经过这种矫正，试验误差将减小，对试验处理效应估计更为准确。若 y 的变异主要由x的不同造成(处理没有显著效应)，则各矫正后的处理间将没有显著差异(但原y间的

展开阅读全文

第二章 数学基础.ppt

第二章数学基础.ppt