t检验的资料与习题.doc

资源描述

《t检验的资料与习题.doc》由会员分享，可在线阅读，更多相关《t检验的资料与习题.doc（19页珍藏版）》请在金锄头文库上搜索。

1、第四章：定量资料的参数估计与假设检验基础1抽样与抽样误差抽样方法本身所引起的误差。当由总体中随机地抽取样本时，哪个样本被抽到是随机的，由所抽到的样本得到的样本指标x与总体指标之间偏差，称为实际抽样误差。当总体相当大时，可能被抽取的样本非常多，不可能列出所有的实际抽样误差，而用平均抽样误差来表征各样本实际抽样误差的平均水平。 x=/S x=S/2 t分布t分布曲线形态与n（确切地说与自由度v）大小有关。与标准正态分布曲线相比，自由度v越小，t分布曲线愈平坦，曲线中间愈低，曲线双侧尾部翘得愈高；自由度v愈大，t分布曲线愈接近正态分布曲线，当自由度v=时，t分布曲线为标准正态分布曲线。t = X-u

2、/Sx=X-u/(S/),V=N-1正态分布（normal distribution）是数理统计中的一种重要的理论分布，是许多统计方法的理论基础。正态分布有两个参数，和，决定了正态分布的位置和形态。为了应用方便，常将一般的正态变量X通过u变换(X-)/转化成标准正态变量u，以使原来各种形态的正态分布都转换为=0，=1的标准正态分布（standard normal distribution）,亦称u分布。根据中心极限定理，通过上述的抽样模拟试验表明，在正态分布总体中以固定n，抽取若干个样本时，样本均数的分布仍服从正态分布，即N（，）。所以，对样本均数的分布进行u变换，也可变换为标准正态分布N (

3、0,1)由于在实际工作中，往往是未知的，常用s作为的估计值，为了与u变换区别，称为t变换，统计量t 值的分布称为t分布。假设X服从标准正态分布N（0,1），Y服从2（n）分布，那么Z=X/sqrt(Y/n)的分布称为自由度为n的t分布,记为 Zt(n)。特征：1以0为中心，左右对称的单峰分布；2t分布是一簇曲线，其形态变化与n（确切地说与自由度）大小有关。自由度越小，t分布曲线越低平；自由度越大，t分布曲线越接近标准正态分布（u分布）曲线，如图.t(n)分布与标准正态N(0,1)的密度函数对应于每一个自由度，就有一条t分布曲线，每条曲线都有其曲线下统计量t的分布规律，计算较复杂。学生的t分布

4、（或也t分布），在概率统计中，在置信区间估计、显著性检验等问题的计算中发挥重要作用。t分布情况出现时（如在几乎所有实际的统计工作）的总体标准偏差是未知的，并要从数据估算。教科书问题的处理标准偏差，因为如果它被称为是两类：（ 1 ）那些在该样本规模是如此之大的一个可处理的数据为基础估计的差异，就好像它是一定的（ 2 ）这些说明数学推理，在其中的问题，估计标准偏差是暂时忽略的，因为这不是一点，这是作者或导师当时的解释。3.均数的参数估计可信区间按一定的概率或可信度 (1-)用一个区间来估计总体参数所在的范围，该范围通常称为参数的可信区间或者置信区间，预先给定的概率(1-)称为可信度或者置信度,常

5、取95%或99%。1. 点估计用样本统计量直接作为总体参数的估计值。其方法简单，易于理解，但为考虑抽样误差的大小。2. 区间估计既按照预先给定的概率（1-a），确定的包含总体参数的可能范围。该范围被称为总体参数的可信区间或置信区间。假设检验基础假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件（P0.01或P，结论为按所取水准不显著，不拒绝H0，即认为差别很可能是由于抽样误差造成的，在统计上不成立；如果P，结论为按所取水准显著，拒绝H0，接受H1，则认为此差别不大可能仅由抽样误差所致，很可能是实验因素不同造成的，故在统计上成立。P值的大小一般可通过查阅相应的界值表得到。t检验

6、若总体服从正态分布N(，)，但未知，记，则t=遵从自由度为n-1的t分布，可对有以下的水平为的检验，其中t为自由度为n-1的t分布的上分位数。这些检验称为t检验。第五章：定量资料的t检验前言：T检验主要用于样本含量较小（例如n30），总体标准差未知的正态分布资料。t检验是用t分布理论来推论差异发生的概率，从而比较两个平均数的差异是否显著。一、t检验分为单总体检验和双总体检验。1.单总体t检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著。当总体分布是正态分布，如总体标准差未知且样本容量小于30，那么样本平均数与总体平均数的离差统计量呈t分布。单总体t检验统计量为：t:为样本平均数

7、与总体平均数的离差统计量：为样本平均数：为总体平均数x:为样本标准差n：为样本容量2.双总体t检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体t检验又分为两种情况，一是独立样本t检验，一是配对样本t检验。独立样本t检验统计量为：S1 和 S2 为两、样本方差；n1 和n2 为两样本容量。（上面的公式是1/n1 + 1/n2 不是减！）1/n1 -1/n2的话无法计算相同的样本空间配对样本t检验统计量为：二、适用条件(1) 已知一个总体均数；(2) 可得到一个样本均数及该样本标准差；(3) 样本来自正态或近似正态总体。三、t检验步骤以单总体t检验为例说明:问题：难产儿出生体重

8、n=35，=3.42，S =0.40，一般婴儿出生体重0=3.30（大规模调查获得），问相同否？解：1.建立假设、确定检验水准H0： = 0 （零假设，null hypothesis）H1： 0（备择假设, alternative hypothesis，）双侧检验，检验水准:=0.052.计算检验统计量3.查相应界值表，确定P值，下结论查附表1，t0.05 / 2.34 = 2.032,t 0.05，按=0.05水准，不拒绝H0，两者的差别无统计学意义当总体呈正态分布，如果总体标准差未知，而且样本容量 30，那么这时一切可能的样本平均数与总体平均数的离差统计量呈t分布。检验是用t分布理论来推论

9、差异发生的概率，从而比较两个平均数的差异是否显著。检验分为单总体t检验和双总体t检验。四、t检验注意事项1、选用的检验方法必须符合其适用条件(注意：t检验的前提是资料服从正态分布) 。理论上，即使样本量很小时，也可以进行t检验。（如样本量为10，一些学者声称甚至更小的样本也行），只要每组中变量呈正态分布，两组方差不会明显不同。如上所述，可以通过观察数据的分布或进行正态性检验估计数据的正态假设。方差齐性的假设可进行F检验，或进行更有效的Levenes检验。如果不满足这些条件，只好使用非参数检验代替t检验进行两组间均值的比较。2、区分单侧检验和双侧检验。单侧检验的界值小于双侧检验的界值，因此更容

10、易拒绝，犯第错误的可能性大。t检验中的p值是接受两均值存在差异这个假设可能犯错的概率。在统计学上上，当两组观察对象总体中的确不存在差别时，这个概率与我们拒绝了该假设有关。一些学者认为如果差异具有特定的方向性，我们只要考虑单侧概率分布，将所得到t-检验的P值分为两半。另一些学者则认为无论何种情况下都要报告标准的双侧t检验概率。3、假设检验的结论不能绝对化。当一个统计量的值落在临界域内，这个统计量是统计上显著的，这时拒绝虚拟假设。当一个统计量的值落在接受域中，这个检验是统计上不显著的，这是不拒绝虚拟假设H0。因为，其不显著结果的原因有可能是样本数量不够拒绝H0 ，有可能犯第类错误。4、正确理解P值

11、与差别有无统计学意义。P越小，不是说明实际差别越大，而是说越有理由拒绝H0 ，越有理由说明两者有差异，差别有无统计学意义和有无专业上的实际意义并不完全相同。5、假设检验和可信区间的关系结论具有一致性差异：提供的信息不同区间估计给出总体均值可能取值范围，但不给出确切的概率值，假设检验可以给出H0成立与否的概率。6、涉及多组间比较时，慎用t检验。科研实践中，经常需要进行两组以上比较，或含有多个自变量并控制各个自变量单独效应后的各组间的比较，（如性别、药物类型与剂量），此时，需要用方差分析进行数据分析，方差分析被认为是T检验的推广。在较为复杂的设计时，方差分析具有许多t-检验所不具备的优点。（进行多

12、次的T检验进行比较设计中不同格子均值时）。第六章定量资料的方差分析6.1 方差分析的基本思想和应用条件6.1.1方差分析的基本思想1. 总变异各样本数值与总均数不同。总变异反映所有观察值的变异，量化值所有数据的均方MS总来表示。SS总=（X-）2 MS总=SS总/v总 v总=N-12. 组间变异各组别间的均数不相同。包括了变量影响和随机误差。SS组间=ni (i -)2 MS组间=SS组间/v组间 v组间=k-13.组内变异组内的个数值不同。反映随机误差，又称误差变异。SS组内=SS总-SS组间MS组内=SS组内/v组内V组内=N-kF=MS组间/MS组内6.1.2方差分析的应用条件1、各样本相互独立切随机，服从正态分布。2、总体方差相等，即方差齐性。 6.2完全随机设计资料的方差分析 6.2.1离均差平方和与自由度分解（见6.1.1公式）6.2.2完全随机设计资料方差分析的基本步骤（1）建立假设检验，确定检验水准。（2）计算检验统计量。变异来源SSvMSFP总变异组间变异组内变异（3）确定P值，做出推断结论。 6.3随机区组设计资料的方差分析 6.3.1离均差平方和与自由度的分解SS总=SS处理+SS区组+SS误差v总=v处理+v区组+v误差变异来源SSvMSF总变异（

展开阅读全文

t检验的资料与习题.doc

最新文档