生物统计学总结-修订编选

资源描述

《生物统计学总结-修订编选》由会员分享，可在线阅读，更多相关《生物统计学总结-修订编选（24页珍藏版）》请在金锄头文库上搜索。

1、生物统计学总结生物统计学总结绪论绪论统计工作的四大步骤：设计、搜集、整理、分析统计工作的四大步骤：设计、搜集、整理、分析统计资料的三大类型：计量资料：对每个观察值单位用定量方法定量方法测得每项指标量的大小所得的资料计数资料：将观察单位按照某种属性类别分组，所得的观察单位数等级资料：将观察单位按某种属性的不同程度分组所得的资料同质与变异同质：除研究因素外，其他因素相同或相近为同质变异：观测值的不齐性总体与样本：总体：根据研究目的所确定的同质观察单位的全体=所有研究对象性质相同的全体观察单位某项变量值的集合总体含量：总体中所包含的观察单位数有限总体：总体观察单位数可

2、数无限总体：总体观察单位数不可数样本：从总体中随机抽取的部分观察单位样本含量：样本中所包含的观察单位数抽样：从总体中获得样本的过程放回式抽样不放回式抽样抽样误差：因个体变异的存在，由抽样而导致的样本指标与总体指标之差统计量：有样本所得指标或数参数：由总体所得指标，关于特征的表征频数：完全相同的观察只出现的次数频率：某一观察值出现的次数与样本含量的比值概率：描述某事物发生可能性大小的一个度量样本空间：一次实验所有可能的结果的集合基本事物：样本空间每一个可能的结果小概率事件：P=0.05 或 P120 个）才足够稳定，所以当样本含量不够大时，不宜取两端百分位数 3）

3、用百分位数确定正常值范围，习惯上 95% 离散趋势的描述离散趋势的描述 1. 极差极差 R：样本资料中最大值和最小值之差在一定程度上能说明样本波动幅度的大小，但它只受样本中两个极端个体数值大小的影响，不能反映样本中各个观测值的变异程度，稳定性差 2. 四分位数间距：四分位数间距：是上四分位数与下四分位数之差,用四分位数间距可反映变异程度的大小. 稳定性好，灵敏度不够 3. 标准差：标准差： 1）定义：描述一组同质计量资料离散程度大小的指标反映了均数对一组观察值的代表性说明了观察值围绕均数分布的离散程度，个体变异 2）计算： 3）应用： 1.表示变量分布的离散程度 2.结合均数

4、描述正态分布特征 3.结合均数计算变异系数 4.结合样本含量计算标准误 4）注意：（1）不同单位，相同标准差，不能比较（2）大个体差异大，变异度大，小个体则变异度小 4.变异系数变异系数 CV 1）定义：标准差与均数之比，用百分数表示 2）计算： 3）应用：单位不同的几组资料变异度及均数相差悬殊的几组资料的变异度的比较，不单独使用自由度自由度泛指可以自由取值的变量的个数正常值：正常动植物解剖生理生化等各种数据的波动范围正常值：正常动植物解剖生理生化等各种数据的波动范围 1）必要性 1.区分正常和异常 2.看不同种群在不同时间地域上某一指标的差异 2）选取 1.极差中的一部

5、分 2.单侧或双侧正常值之分，由指标实际情况及实验要求确定 3.方式之一为正常值范围的百分位数，习惯上 95% 双侧：确定 P2.5 或 P97.5 单侧：P5 或 P95，看实验需要计量资料的统计推断计量资料的统计推断统计推断统计推断用样本信息推断总体特征参数估计：由样本结果对总体参数在一定概率水平下所做出的估计假设检验正态分布正态分布 1）概念：一种连续型随机变量的概率分布密度函数：分布函数： 2）特征： 1.在横轴上均数处最高 2.以均数为中心，左右对称 3.有两个参数 4.曲线下的面积分布有一定的规律 F(x) 3）应用： 1.以曲线下的面积反映频率及概率分布 2

6、.估计正常值范围或正常值范围的正态分布法双侧正常值范围 3.质量控制 4.正态分布是很多种统计方法的理论基础标准正态分布，u 分布 U与面积的关系对数正态分布原观察值 x 呈偏态（正偏），取对数后，lgX 呈正态分布x 服从对数正态分布均数的抽样误差均数的抽样误差 1.定义：平均数与总体均数之差 2.均数抽样误差大小的度量标准误标准误 1）定义：样本均数的标准差 2）意义：反映抽样误差的大小是样本均数围绕总体均数分布的离散程度，衡量了样本均数的可靠程度 3）计算：一般一次抽样估计总体没有标准误，只针对样本 4）用途：（1）计算可信区间（参数估计）（2）用于统计推断

7、（假设检验） t 分布分布 1.t 变换与 t 变量 2.t 分布的特征 1）单峰，一 0 为中心，左右对称 2）曲线中间比正态分布低，两端翘得比正态分布高 3）有无数根，中间越低，两端越翘 t 分布与自由度有关，自由度越小，中间越低，两端越翘当自由度趋向无穷时，t 分布趋向标准正态分布，tu 3.概率密度函数与分布函数 4.t 介值与 t 介值表 t,：给定自由度为，两侧双尾面积之和为时，相应 t 值。 5.t 分布原理：P(-t,= t = t,)=1- 方差分析方差分析方差分析又叫变量分析，俗称 F 检验用途： 1.两个或多个均数的比较 2.分离各有关因素，并分别估计其对变异

8、的作用 3.分析两个或多个因素的交互作用 4.方差齐性检验适用条件（用于多个均数比较时） 1.个样本是相互独立的随机样本 2.小样本要求正态方差齐基本思想：把全部观察值之间的变异，总变异，按设计需要，分为两个或多个组成部分再作分析计算总体均数的估计总体均数的估计 1.总估计 2.区间估计： 1）定义：按一定的概率估计总体均数在什么范围内可信区间：按一定的概率估计总体均数的可能范围 2）方式： 1.t 分布法：按 t 分布的原理估计总体均数在什么范围内适用于总体标准差未知且 n50 总体标准差已知： n50：假设检验假设检验为什么做假设检验为什么做假设检验检验差别是否由抽样

9、误差造成的基本思想基本思想假定差别是由抽样误差引起的然后计算由抽样误差引起这么大，甚至比这更大的差别的概率 P 根据小概率原理，作出拒绝或者接受假设的判断步骤步骤 1.建立假设，确定检验水准先确定是单侧还是双侧的若考虑 u，u0有误差别双侧若不仅考虑差别，还关注 u，u0大小单侧一般认为双侧无效假设 H0：从反证法的基础上提出的，无论何时，假设差别是由抽样误差造成的，但具体问题具体分析备择假设 H1：与 H0相对立的假设，是依 H0而产生的，一旦 H0不成立，只能接受 H1，现在 H0不成立非 H0 体现单双侧之分检验水准：界定小概率事件的一个标准（有单双侧之分）通常

10、=0.05 2.选定检验方法，计算统计量 3.确定 P 值，做出统计推断 P 值：指由 H0所规定的总体中做随机抽样，获得等于大于或小于现有统计量的概率。若 P，接受 H0 第一类错误和第二类错误第一类错误和第二类错误第一类：拒绝实际上成立的 H0 第二类：不拒绝实际上不成立的 H0 客观实际拒绝 H0不拒绝 H0 H0成立第一类错误（）推断正确（1-） H0不成立推断正确（1-）第二类错误（）可信度 1- 把握度：未知，只能估计，不能单独存在，只有与 H1结合才有意义检验效能 1-：计量总体却有差别，按水准，能够发现他们有差别的能力注意注意 1.样本的代表性组间的均衡性资料的可比性

11、 2.选用的假设检验方法一定要符合其适用条件 3.正确理解差别有无显著性的含义（显著、极显著不意味着差别的大小） 4.结论不能绝对化 5.报告要规范化检验方法检验方法一、完全随机设计一、完全随机设计（一）样本均数与已知总体均数比较的假设检验（一）样本均数与已知总体均数比较的假设检验 1.小样本，总体标准差未知t 检验（要求取自正态总体） 2.大样本，总体标准差未知： 1)t 检验（严格）法 2 无需来自正态总体 2)u 检验（，tu）法 1 3.大样本，总体标准差已知u 检验（二）两个样本均数比较的假设检验（二）两个样本均数比较的假设检验 1.小样本（有一个就算），总体标准差未知

12、，正态方差齐t 检验 A.先求合并方差 B.再求两样本均数差的标准误 C.计算 t 值 2.小样本（有一个就算），总体标准差未知，方差不齐（非正态） 1)采用适当的变量变换使达到方差齐性的要求 2)采用不要求方差齐的方法比较非参数统计 3)采用近似的 t检验 3.大样本u 检验（不考虑正态方差齐的情况下，仍可用 t 检验）（三）两个样本几何均数比较的假设检验（三）两个样本几何均数比较的假设检验对 x 取反对数，用 t 检验或者 u 检验（四）多个样本均数的比较（单因素方差分析）（四）多个样本均数的比较（单因素方差分析）条件： 1.个样本是相互独立的随机样本 2.小样本要求正态方差齐

13、*多个样本均数间的两两比较多个样本均数间的两两比较q 检验检验二、配对设计二、配对设计（一）配对设计的计量资料的比较（一）配对设计的计量资料的比较小样本，t 检验t = / 三、配伍组设计三、配伍组设计（一）多个样本均数的比较（两因素方差分析）（一）多个样本均数的比较（两因素方差分析）多个性质相同的配伍，同一配伍组中的 N 个受试对象分别接受 k 种处理作用： 1.可改善处理组间的均衡性 2.可分析配伍因素的的影响 3.提高设计效率，分析两个因素 *多个样本均数间的两两比较多个样本均数间的两两比较q 检验检验正态性检验正态性检验一、为什么做正态性检验一、为什么做正态性检验特定

14、统计方法要求的描述统计平均数、标准差正常值范围的正态统计法统计推断 t 检验 F 检验二、定义二、定义判定资料是否服从正态分布或样本是否来自正态总体的一类检验方法三、何时用？三、何时用？ 1.为了说明资料是否服从正态分布一定要做 2.为了满足特定统计方法的需要可以不做四、怎么做？四、怎么做？正态分布分布的特征： 1.对称性偏度（正偏、对称、负偏）三阶偏度系数 g1 态峰翘度（正态峰、尖峭峰、平阔峰）四阶峰度系数 g2 方差齐性检验方差齐性检验一、为什么？一、为什么？ 1.t 检验 F 检验使用条件的要求 2.方差的抽样波动二、定义二、定义说明变量值的变异度有无

15、差别，或者通过样本信息来推断总体方差是否相等的一类检验方法三、何时做？三、何时做？ 1.说明变量值的变异度有无差别时一定做 2.为满足 t、F 检验方差齐性要求的可不做四、如何做？四、如何做？多个方差的齐性检验X2检验变量变换变量变换意义：通过改变观察值的原初形式，使资料正太化，达到方差齐性的要求，以满足 t 检验及方差分析的应用条件依据：只改变观察值的分布形式，而不是其相对大小常用方法： 1)对数变换：对数变换：以观察值 x 的对数值作为新的分析数据常用方式适用场合： 1.使服从对数正态分布的资料正态化 2.使方差达到方差齐性要求，特别是标准差与均数的比值接近时 3.使指

16、数曲线直线化，常用于曲线拟合 2)平方根变换平方根变换：以原观察值 x 的平方根作为新的分析数据常用方式适用场合： 1.使服从 Poisson 分布的计数资料或轻度偏态资料正态化 2.使各样本的方差与均数的正比例关系消除或削弱，达到方差齐性要求 3)百分数、平方根、正反弦变换百分数、平方根、正反弦变换以原观察值用百分数表示，平方根反正弦值作为新的分析数据适用场合：总体百分数小于 30%或大于 70%的情形计数资料的统计描述和推断计数资料的统计描述和推断相对数相对数（一）为什么引入（一）为什么引入绝对数不能做进一步分析（二）什么是相对数（二）什么是相对数同一基础上，两个有联系指标之比 *常用指标 1.率/频率指标：用以说明某现象发生的频率与强度计算比例基数可能发生某现象的总数某现象的发生数比例基数依习惯而用使算的的率至少保留 1-2 位整数 2.构成比/构成指标：用以说明某一事物内部各组成部分所占的比重或分布总和为 100% 计算%100 位总数同一事物各组分观察单某一组分的观察

展开阅读全文

生物统计学 总结-修订编选

生物统计学总结-修订编选