生物统计学考试总结

上传人:鲁** 文档编号:487894857 上传时间:2023-02-05 格式:DOC 页数:8 大小:745KB
返回 下载 相关 举报
生物统计学考试总结_第1页
第1页 / 共8页
生物统计学考试总结_第2页
第2页 / 共8页
生物统计学考试总结_第3页
第3页 / 共8页
生物统计学考试总结_第4页
第4页 / 共8页
生物统计学考试总结_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《生物统计学考试总结》由会员分享,可在线阅读,更多相关《生物统计学考试总结(8页珍藏版)》请在金锄头文库上搜索。

1、概述生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,属于应用统计学的一个分支。内容:试验设计:试验设计的基本原则、试验设计方案的制定和常用试验设计的方法统计分析:数据资料的搜集、整理和特征数的计算、统计推断、方差分析、回归和相关分析、协方差分析等生物统计学的作用:1. 提供整理、描述数据资料的科学方法并确定其特征2. 判断试验结果的可靠性3. 提供由样本推断总体的方法4. 试验设计的原则相关概念:1.总体:研究对象的全体,是具有相同性质的个体所组成的集合2.个体:组成总体的基本单元3.样本:由总体中抽出的若干个体所构成

2、的集合 n30 大样本; n30 小样本4.参数:描述总体特征的数量5.统计数:描述样本特征的数量 由于总体一般很大,有时候甚至不可能取得,所以总体参数一般不可能计算出来,而采用样本统计数来估计总体的参数6.效应:由因素而引起试验差异的作用 7. 互作:两个或两个以上处理因素间的相互作用产生的效应生物统计学的研究包括了两个过程:1. 从总体抽取样本的过程抽样过程2. 从样本的统计数到总体参数的过程统计推断过程第1章 试验资料的集中性与变异性1算术平均数:是所有观察值的和除以观察的个数 平均数(AVERAGE)特性:(1)样本中各观测值与平均数之差离均差的总和等于零(2)样本中各观测值与其平均数

3、之差平方的总和,比各观测值与任一数值离均差的平方和小,即离均差平方和最小 中位数:将试验或调查资料中所有观测依从大小顺序排列,居于中间位置的观测值称为中位数,以Md表示 众数:在一个样本的所有观察值中,发生频率最大的一个值称为样本的众数,以Mo表示2几何平均数:资料中有n个观测值,其乘积开n次方所得的数值,以G表示。 极差(全距):样本数据资料中最大观测值与最小观测值的差值Rmaxx1,x2,xn mixx1,x2,xn 3样本标准差: (1)标准差的大小,受多个观测值的影响,如果观测值与观测值间差异大,标准差就大(2)在计算标准差的时候,如果对各个观测值加上或者减去一个常数a,其标准差不变;

4、如果乘以或除以一个常数a,则标准差扩大或者缩小a倍 STDEV: 基于给定样本的标准偏差 STDEVP:基于给定样本总体的标准偏差4.变异系数(CV):样本标准差除以样本的平均数,得到百分比(1)变异系数是样本变量的相对变量,是不带单位的纯数(2)用变异系数可以比较不同样本相对变异程度的大小第2章 概率及其分布一、概率的计算法则:(1)乘法定理:如果A和B为独立事件,则事件A和B同时发生的概率等于各自事件的概率的乘积(2)加法定理:互斥事件A和B的和的概率等于事件A和事件B的概率之和 加法定理推理1: 如果A1、A2、An为n个互斥事件,则其和事件的概率为: P(A1A2An)=P(A1)+P

5、(A2)P(An)加法定理:如果A和B是任何两件事件,则二、概率分布:1、离散型随机变量的概率分布变量(x) x1 x2 x3 xn概率(P) p1 p2 p3 pn P(x=xi)=pi (i=1,2, n)离散随机变量的方差 2、连续型随机变量的概率分布1. 连续型随机变量可以取某一区间或整个实数轴上的任意一个值2. 它取任何一个特定的值的概率都等于03. 不能列出每一个值及其相应的概率4. 通常研究它取某一区间值的概率5. 用数学函数的形式和分布函数的形式来描述 (1)概率密度函数:(1)设X为一连续型随机变量,x 为任意实数,X的概率密度函数记为f(x),它满足条件(2) ,f(x)不

6、是概率(2)几种常见的概率分布:(适用范围,尾函数,自由度)1. 二项分布的概率函数 记作B(n,p)或者B(n,)(1)每次试验只有两个对立结果,分别记为A与B,它们出现的概率分布为p与q(q1-p) (2)试验具有重复性和独立性 二项式分布的概率累积函数: 若随机变量x服从二项式分布,则有二项分布的总体平均数为: 二项分布的总体标准差为: 二项成数(百分数)分布的平均数: 二项成数(百分数)分布的标准差:例:假设年龄6064岁的100名男性在1986年注射了一种新的流感疫苗而在第二年内死亡5人,这正常嘛?(注:1986年,6064岁的男性老人第二年的死亡率约为0.02)解:要知道100个男

7、性的样本死亡5人是不是“异常”事件,这种估计的一个准则是寻找至少5人死亡的概率。注:通常是把概率值为0.05或者更小的概率事件识别为异常(稀有事件)。由于至少5人死亡的概率是0.05,可见100人中至少死亡5人是稍微有点异常,但不是很异常。 如果至少死亡10人,那么概率是3.44*10-5,这就很不正常,因而,在没有其他证据显示此疫苗有效前,应考虑停止使用。 2. 泊松分布二项式分布中,如果p值很小而n值很大( p0.1 和np5 ),则泊松分布 式中: 为参数,泊松分布的平均数、方差、标准差例:假如我们研究乳腺癌的遗传敏感性。我们发现,母亲曾患有乳腺癌的1000名4049岁的妇女,在研究开始

8、后的1年中,有4人患有乳腺癌,而我们从大总体中知道在这相同的时间内,1000人中有1个人发生乳腺癌。试问乳腺癌有没有敏感性?解:如果用二项分布,则n1000,p1/1000,BINOMDISTnumber_sTrialsprobability_scumulative310000.001Ture0.9810.019解:如果用泊松分布,则n1000,p1/1000, 则平均值 1则:这个事件是异常事件,则认为有乳腺癌的妇女,她们的子代具有遗传敏感性6. 正态分布求和为0 4 t分布:是小样本分布,小样本分布一般是指n1时,与连续型随机变量卡方分相近似,这时可以不做连续性矫正 注意:要求各个组内的理论次数不小于5,如某组理论次数小于5,则应把它与其相邻的一组或几组合并,直到理论次数大于5为止二、 适合性检验(吻合性检验或拟合优度检验) 步骤:1. 提出无效假设,即认为观测值和理论值之间没有差异 2. 规定显著性水平 3. 计算样本卡方值 4. 根据规定的显著水平和自由度计算出卡方值,再和实际计算的卡方值进行比较三、 独立性检验 步骤:1. 提出无效假设,即认为所观测的各属性之间没有关联 2. 规定显著性水平 3. 根据无效假设计算出理论数 4. 根据规定的显著水平和自由度计算出卡方值,再和计算的卡方值进行比较。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > 总结/计划/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号