《生物统计与试验设计》由会员分享,可在线阅读,更多相关《生物统计与试验设计(29页珍藏版)》请在金锄头文库上搜索。
1、生物统计与试验设计李齐发南京农业大学动物科技学院2010 南京几点说明1.1.课程成绩课程成绩作业作业 20分分考勤考勤 10分分期末考试期末考试 70分分2.2.期末考试期末考试3.3.教教 材材英译汉英译汉 10分分名词解释名词解释 20分分简答题简答题 30分分计算题计算题 40分分4.4.计计 算算 器器5.5.课堂纪律课堂纪律第一章 概 论 生物统计学常用术语生物统计学常用术语 生物统计学的内容生物统计学的内容 生物统计学的特点生物统计学的特点 生物统计学的概念生物统计学的概念第一节 生物统计学的概念生物统计学(biostatistics)就是用概率论和数理统计学的原理与方法来处理生
2、物学资料的学科 达尔文时代以前的生物学,一般以描述为主颜色颜色形状形状大小大小羽色羽色冠形冠形体格体格白羽白羽黑羽黑羽黄羽黄羽横斑纹横斑纹白来航鸡白来航鸡 狼山鸡狼山鸡 正阳三黄鸡正阳三黄鸡 芦花鸡芦花鸡 单冠单冠豆冠豆冠玫瑰冠玫瑰冠草莓冠草莓冠茶花鸡茶花鸡 旧院黑鸡旧院黑鸡 泰和乌鸡泰和乌鸡 泰和乌鸡泰和乌鸡大型鸡大型鸡小型鸡小型鸡萧山鸡萧山鸡 矮小鸡矮小鸡 随着生物学的发展,描述已无法满足科学研究的需要,于是就有了度量 有了度量以后就产生了大量的数据资料,那么,如何来处理、分析这些看似杂乱无章的数据资料,并且发现其内在的规律采用一般的数学方法来采用一般的数学方法来进行计算进行计算用概率论和
3、数理统计学用概率论和数理统计学的原理与方法的原理与方法生物统计学力不从心,甚至是无能为力力不从心,甚至是无能为力 生物统计学是动物科学研究和生产实践中必不可少的工具,现已被广泛应用于各个方面: 遗传、育种 营养、饲料 基因组分析 遗传图谱构建 QTL定位在国外特别是经济发达的国家,生物统计学已经渗透到生物学相关的各个领域:课题申请论文审稿新药研发专设机构生物统计学的思维和方法已经渗透到动物生产实践和科学研究之中与国外相比,国内缺乏从事生物统计学研究的专业人员 畜牧与兽医畜牧与兽医杂志的审稿杂志的审稿 与农业部动物检疫所(青岛)的合作与农业部动物检疫所(青岛)的合作 本科毕业论文答辩本科毕业论文
4、答辩孟德尔遗传定律、生物进化理论、分子数量遗传学和生物信息学等,它们的发现、诞生和发展,都离不开生物统计学的参与 随着分子生物学的发展,生物统计学越来越显示出它的重要性 第二节 生物统计学的特点1. 概率性概率性(Probability)2. 二元性二元性(Duality)3. 归纳性归纳性(Induction)1. 概率性概率性生物学数据具有变异性生物学数据具有变异性针对生物性状进行研究得出一个结论时,这个结论的正确性往往是针对生物性状进行研究得出一个结论时,这个结论的正确性往往是相对相对的、有条件的的、有条件的,这个条件可以用,这个条件可以用概率值概率值来表示来表示不能通过不能通过描述性的
5、定性科学描述性的定性科学或或决定性的数量科学决定性的数量科学来解决生物学领域中的来解决生物学领域中的很多问题很多问题 动物的血液是红色的冰鱼的血液是黄色的马蹄蟹的血液是蓝色的天下乌鸦一般一般黑 形容万恶的旧社会官官相护形容万恶的旧社会官官相护 20042004年年央视国际央视国际报道:在印度报道:在印度南部的一个小村庄发现了一只南部的一个小村庄发现了一只白色白色的乌鸦的乌鸦出现了白色的乌鸦,就认为“天下乌鸦一般黑”的观点就是错误的出现了黄色血液的冰鱼,就认为“动物的血液是红色的”的结论是不正确的 按照某些学科的推理,如果出现反例就必须要否定原来的结论如果从生物统计学的角度来看,如果从生物统计学
6、的角度来看,结果会完全不同结果会完全不同至少有至少有95%以上的动物的血液是以上的动物的血液是红色的红色的至少有至少有99%以上的乌鸦是黑色的以上的乌鸦是黑色的 经典数学的计算结果是绝对的、明确的,也是唯一的经典数学的计算结果是绝对的、明确的,也是唯一的 生物统计学从复杂多变的生物性状中得出的结论一般都只能在一定的概率生物统计学从复杂多变的生物性状中得出的结论一般都只能在一定的概率保证下认为是正确的,同时得到的结果也不是唯一的保证下认为是正确的,同时得到的结果也不是唯一的 生物统计学不同于经典数学现在概率的思想越来越深入到每个人的生活中 午后有阵雨,午后有阵雨,雷雨时短时阵雷雨时短时阵风风降水
7、概率降水概率75%,东南风转西,东南风转西北风北风2. 二元性二元性 生物统计学的理论体系生物统计学的理论体系概率论概率论 大量的、来源于生产实践的数据资料大量的、来源于生产实践的数据资料 生物统计学是理论与实践并重的一门学科,有时处理实践资料甚至重于理论指导 生物统计学的二元性: 理论与实践并重 理论与实践密切结合 3. 归纳性归纳性理论上我们总希望能获得并处理具有同一性质的所有资料归纳性是生物统计学的主要精神,简单地说就是从部分资料(统计学中称为样本)中归纳出一般性的原理并把它应用到较大的范围(统计学中称为总体) 猪猪链链球球菌菌病病研研究究 四川地区四川地区病人主要病人主要是通过接是通过
8、接触性的伤触性的伤口感染猪口感染猪链球菌病链球菌病人感染猪链球菌病,主要是通过接触性的伤口传播 广东广东东京东京纽约纽约在科学研究和生产实践中只能获得其中很小的、但具有代表性的一部分个体来进行研究、分析和处理 第三节第三节 生物统计学的主要内容生物统计学的主要内容生物统计学是动物科学专业的专业基础课程生物统计学是动物科学专业的专业基础课程生物统计学主要包括两大部分内容:生物统计学主要包括两大部分内容:1. 统计部分1.1 描述性统计 主要是数据资料的整理、分析,是生物统计学的基础内容主要是数据资料的整理、分析,是生物统计学的基础内容(1 1)数据资料的整理)数据资料的整理(2 2)数据资料特征
9、值的计算)数据资料特征值的计算(3 3)概率分布和抽样分布)概率分布和抽样分布1.2 统计推断又称假设检验,是生物统计学的核心内容又称假设检验,是生物统计学的核心内容 (1)t-检验主要用于检验主要用于检验2 2个平均数个平均数间差异是否显著间差异是否显著(2)2-检验 主要用于检验由质量性状得来的主要用于检验由质量性状得来的次数资料次数资料的显著性的显著性(3)F-检验 主要用于检验主要用于检验多个平均数多个平均数间差异是否显著间差异是否显著(4)非参数检验 主要用于检验主要用于检验样本容量小、未知分布样本容量小、未知分布资料的显著性资料的显著性1.3 相关与回归分析通过对数据资料的相关、回
10、归分析,揭示出试验指标间的内在联系通过对数据资料的相关、回归分析,揭示出试验指标间的内在联系,为为动物生产提供强有力的依据动物生产提供强有力的依据(1 1)简单相关简单相关(2 2)简单回归简单回归(3 3)曲线回归曲线回归(4 4)多元回归多元回归2. 试验设计部分主要是试验设计的基本原理、方法主要是试验设计的基本原理、方法u 完全随机设计u 配对设计u 拉丁方设计u 正交设计u 随机区组设计u 交叉设计第四节 生物统计学常用术语1. 变量与观测值变量(变量(variable)是指不同个体间表现变异性的某种特征)是指不同个体间表现变异性的某种特征对于一个个体来说,通过度量所得到的某一变量的具
11、有变异性质的数值就对于一个个体来说,通过度量所得到的某一变量的具有变异性质的数值就称为观测值(称为观测值(observation)2. 总体与样本总体(总体(population)是指研究的全部对象,即具有相同性质的观测值所组)是指研究的全部对象,即具有相同性质的观测值所组成的的集合成的的集合相似的生物体所组成的集合,如同一物种,不是统计学意义上的总体只有相似生物体所具有的某一相只有相似生物体所具有的某一相同性状所表现出来的值的集合才同性状所表现出来的值的集合才能作为统计学中的总体能作为统计学中的总体总体中的每一个研究对象称为个体(总体中的每一个研究对象称为个体(individual)无限总体
12、既有时间内涵,又有空间(地域)内涵。当我们把某一总体限无限总体既有时间内涵,又有空间(地域)内涵。当我们把某一总体限定于某一时间、某一地域时,无限总体就成了有限总体定于某一时间、某一地域时,无限总体就成了有限总体 总体按所含的个体数量可以分为无限总体和有限总体禽流感鸡的产蛋量无限总体无限总体2005年年辽宁黑山辽宁黑山有限总体有限总体 总体按研究对象又可以分为现实总体和假想总体 猪链猪链球菌球菌病病2 2型疫型疫苗的苗的免疫免疫效果效果假想这一部分被试猪假想这一部分被试猪就来自于已注射新疫就来自于已注射新疫苗的猪的总体苗的猪的总体这一总体在疫这一总体在疫苗推广之前并苗推广之前并不存在不存在假想
13、总体当新疫苗试验当新疫苗试验成功并加以推成功并加以推广后这一总体广后这一总体就存在了就存在了现实总体(1)总体往往是无限的、假想的 在实际工作中不可能对总体中所有的观测值一一加以考察,而只能对其中具有代表性的一小部分观测值进行研究 (2)有限的总体有时也包含数目相当多的个体,要获得全部观测值须花费大量人力、物力和时间(3)有些性状的测定、观测值的获得带有破坏性样本样本(sample)就是从总体中抽得的一部分具有代表性的观测值所组成的就是从总体中抽得的一部分具有代表性的观测值所组成的子集子集为了使所得到的样本能无偏地估计总体,必须使总体中每一观测值都有同等的机会进入样本,这种抽样方法称为随机抽样
14、(random sampling) 随机抽样法所得到的样本称为随机样本(random sample)样本中所包含的观测值的个数,称为样本容量样本中所包含的观测值的个数,称为样本容量 用用n n表示表示 有限总体的大小(总体容量),用有限总体的大小(总体容量),用N N表示表示 n30n30的样本称为小样本的样本称为小样本 n n3030的称为大样本的称为大样本 原则:大动物样本容量可小一些,小动物样本容量可适当大一些3. 参数与统计量 反映数据集中趋势的总体平均数 参数(参数(parameter):由总体各观测值所获得的、用来描述总体特征的数值):由总体各观测值所获得的、用来描述总体特征的数值
15、反映数据变异程度的总体标准差 参数是一个真值、一个定值,不变化 用表示用表示统计量(统计量(statistic):由样本各观测值计算得到的、用来描述样本特征的数值):由样本各观测值计算得到的、用来描述样本特征的数值 样本平均数 样本标准差 用用S表示表示 统计量是变化的,不固定的用用 表示表示 统计量和参数的关系 从同一总体中抽取不同的样本所计算得到的同一性质的统计量是不相同的,但这些统计量都可以用来估计相应的参数 在绝大多数情况下,参数很难直接由计算得到,而只能通过样本的统计量来进行估计 4. 准确度与精确度 准确度(准确度(accuracy)也称为准确性,是指观测值与真值接近的程度)也称为
16、准确性,是指观测值与真值接近的程度 精确度(精确度(precise)也称为精确性,指在同一处理条件下,同一批观测值间)也称为精确性,指在同一处理条件下,同一批观测值间相互接近的程度相互接近的程度 准确度高、精确度高 在很多情况下,准确度和精确度两者往往不可兼得,因此在制订试验方案在很多情况下,准确度和精确度两者往往不可兼得,因此在制订试验方案或进行试验时,应当很好地加以权衡或进行试验时,应当很好地加以权衡 准确度低、精确度低 准确度低、精确度高 原则上,可以适当放弃一些精确度以保证足够的准确度原则上,可以适当放弃一些精确度以保证足够的准确度 5. 随机误差和系统误差 误差(误差(error):
17、试验结果和真值之间的差异和偏离):试验结果和真值之间的差异和偏离5.1 随机误差随机误差(random error)又称为偶然误差,是指由各种偶然因素引起的、无法加以预测和控制的无规律的偏差 (1)偶然性随机误差的性质随机误差的性质: :(2)恒在性(3)独立性(4)影响精确度n 随机误差是进行统计假设检验的基础,没有随机误差就没有统计假设检验 n 生物统计学就是为误差而诞生的,生物统计学的全部意义就是处理和估计误差5.2 系统误差系统误差(systematic error)也称为片面误差,是指由于某些特定的非试验条件所造成的使试验结果朝某一个方向发生有规律的偏移 (1)度量工具的不正确 (5)试验人员操作或观测时的偏爱和习惯 (2)试验仪器未经校正 (3)外界试验条件发生了很大的变化(4)观测时间的影响 (6)试验动物分组时发生的偏差 当发生系统误差时,观测值都会有规律地向某一个方向偏离真值,因而降当发生系统误差时,观测值都会有规律地向某一个方向偏离真值,因而降低了试验的准确度。系统误差是可以被消除的低了试验的准确度。系统误差是可以被消除的 为了有效地控制误差,确保试验的准确度和精确度,在试验设计和试验过程中,应当注意以下几个问题: 试验动物的一致性试验动物的一致性 环境条件的一致性环境条件的一致性 操作管理的一致性操作管理的一致性