生物统计学课件--1绪论,数据整理

上传人:我** 文档编号:117887325 上传时间:2019-12-11 格式:PPT 页数:38 大小:932.50KB
返回 下载 相关 举报
生物统计学课件--1绪论,数据整理_第1页
第1页 / 共38页
生物统计学课件--1绪论,数据整理_第2页
第2页 / 共38页
生物统计学课件--1绪论,数据整理_第3页
第3页 / 共38页
生物统计学课件--1绪论,数据整理_第4页
第4页 / 共38页
生物统计学课件--1绪论,数据整理_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《生物统计学课件--1绪论,数据整理》由会员分享,可在线阅读,更多相关《生物统计学课件--1绪论,数据整理(38页珍藏版)》请在金锄头文库上搜索。

1、生 物 统 计 学 主讲:于丽杰 2008.2.25-6.21 教 研 室: 植物生物学教研室 研究方向: 植物基因工程 发育植物学 办 公 室: 生物楼132室 319室 第一章 绪论 第一节 生物统计学的性质和作用 一、什么是生物统计学 1、定义: 生物统计学就是运用统计学的原理和方法,来研究生物 界数量现象的科学方法。 它是一门应用统计方法或数学逻辑来搜集、整理、分析 和解释生物界数量现象的科学方法。是统计学和生物科学相 结合的边缘学科。 工具:显微镜、电子显微镜、 2、生物统计学的特点、属性: 归纳性、概率性 要求个体间的度量值而不是个体间的分类,要求的是数据而 不是修饰词 二、为什么

2、要学习生物统计学 1.“生物统计学”能为我们提供数据整理分析的 方法 2.“生物统计学”能为我们提供由样本推断总体 的方法 3.“生物统计学”能为我们分析变异因素提供一 系列决策和方法 4.“生物统计学”可以帮助我们分析现象之间的 关系 5.“生物统计学”对实验设计也有指导作用 第二节 学习生物统计学的预备知识 一、总体和样本 (一)总体 具有共同性质的个体所构成的集团 无限总体 有限总体 (二)样本 由总体中随机抽取的若干个体所构成的集团 样本容量(n) 大样本, (n30) 小样本, (n 30 ) 随机样本(总体中每个个体进入到样本中的机会均等) 二、变数和变量 1.变数 X、Y 2.变

3、量 x1、x2、x3、 观察值: 对个体(数量)性状的测量值。 三、参数和统计量 1.参数 由总体中全部个体观察值所算得的总体的特征数。 特征数,如平均数、标准差 2.统计量 由样本中全部个体观察值所算得的样本的特征数。 标准差s、平均数 四、误差、偏差和错误 误差=观察值-真值 偏差=观察值-平均观察值 误差和偏差统称为“随机误差”,简称“机误” 错误: 由于实验操作的粗枝大叶而造成的错误,可以通过提高操作 者的责任心而得到克服。 五、准确度和精确度 准确度:观察值与真值之间的符合程度。 精确度:重复观察值之间彼此相符合的程度。 复习思考题 绪 论 什么叫总体?什么叫样本?如何使抽取的样本具

4、 有代表性? 精确度的概念及作用? 错误和误差是一回事吗?如何克服试验中发生错 误? 生物统计学的基本特点是什么? 第二章 数据整理 第一节 频数分布 一、试验资料的性质 数量性状的资料 质量性状的资料 (一)、数量性状的资料 1.连续型数据(度量数据) 2.离散型数据(间断、不连续数据) (二)、质量性状的资料 能观察而不能量测的性状,如花色、有芒无芒 1.应用统计次数的方法 2.给予每类性状以相当的数量 二、频数表和频数图的绘制 (一)离散型数据资料的整理 例1:调查每天出生的10名新生儿中,体重超过3kg的人数 ,共调查120天。试对调查数据进行整理。 分析:每天的10名新生儿中,体重超

5、过3kg的人数 调查120天,将获得120个原始数据, 排列没有规律 可能有11种情况:1名也没有,有1名,有两名,10名 都是。共11种可能。 处理:按11种可能的情况进行分组,称每一种情况为组值 。 每10名新生儿体重超过3kg 的人数的频数(率)表 组值组值 (体重超过过3kg 的人数 ) 频频数计计算频频数频频率 0 1 2 3 4 5 6 7 8 9 10 总计总计 一 正正 正正正口 正正正正正正正口 正正正正正正口 正正 三 0 0 0 1 2 12 19 39 34 10 3 120 0.000 0.000 0.000 0.008 0.017 0.100 0.158 0.324

6、 0.283 0.083 0.025 0.999 例2、某农场在做高粱“三尺三 ”提纯时,调查了100株高粱的株 高数据,结果如下(单位:cm): 分析:连续型数据。 数据分布范围: 170-141=29 分组? 155 153 144 156 150 157 160 150 150 160 156 150 160 155 160 151 157 155 159 161 156 141 156 145 156 153 158 161 157 149 153 153 155 162 154 152 162 162 161 159 161 156 162 151 152 154 157 162 1

7、58 155 153 151 157 156 153 147 158 155 148 163 155 153 159 155 150 159 157 159 151 152 159 158 170 163 154 158 152 163 158 154 164 155 156 158 164 148 164 154 157 165 158 166 154 154 157 167 157 159 156 158 ,试对数据进行整理 。 (二)、连续型数据种资料的整理 1.求极差 R = max x min x 2、确定组数和组距 数据个数 分组时的组数 50 5-10 100 8-16 200

8、10-20 300 12-24 500 15-30 1000 20-40 3、选定组限、组界和组中点值 4、归组,统计各组的频数和频率 三、属性性状资料的整理 (四)、频数(率)分布图 1、直方图(用于连续型数据) 图2-1 “三尺三”高粱株高的直方图 2、多边形图 (用于连续型数据) 图2-2 “三尺三”株高的多边形图 3、条形图(二维) (用于离散型数据) 3、条形图(三维,也称柱形图) 4、累积频数图 (五 )、研究频数分布的意义 1、根据频数分布,可以看出数据的集中情况,常用平均数 表示全部数据的集中点。 2、根据频数分布,可以看出数据的变异情况,一般以变异 数反映数据的离中趋势和变异

9、性。 3、从频数分布图可以看出曲线的形状。 (六)、频数(率)分布的不恒定性 由于抽样具有随机性,即使在同一总体中抽出 的两个样本容量相同的样本,其样本的频数分布也 不完全一致,有时差异还会很大,这就是频数分布 的不恒定性。 因此,当用样本推断总体时,推断的结果也会 有所不同;这就需要对总体的分布有所了解,在后 续章节中我们会涉及相关的问题。 第二节 平均数和变异数 一、平均数 (一)、平均数的意义和种类 平均数是数量资料的代表值,表示资料中观察值 的中心位置,并且可以作为资料的代表值与另一 组资料相比较,借以明确二者间相差的情况。 1、算术平均数 一个数量资料中各个观察值的总和除以观察值的

10、个数所得的商数,称为算术平均数,记作 , 简称为平均数或均数。 2、中位数 Md 将资料内所有观察值按从大到小排列,居于中间位置的观 察值称为中位数。 奇数、偶数 3、众数 Mo 资料中最常见的观察值或频数最多的一组中点值,称为众 数。 4、几何平均数 G 如有n个观察值,其相乘积再开n次方所得的数值,即为几 何平均数。 (二)、算术平均数的定义公式及其基本特征 1、算术平均数的定义公式 2、算术平均数的基本特征 算术平均数的大小受每个观察值的影响。 如果每个xi都相乘以相同的k,则平均数也应乘以k 。 如果每个xi都相加上相同的A,则平均数也应加上A 。 如果 是n1个数的平均数, 是n2个

11、数的平均数, 那么全部 n1+n2个数的算术平均数是加权平均数, *离均差的代数和是“零”。 *离均差的平方和最小。 其中 。 (三)、算术平均数的计算方法 1、非频数资料(小样本) 直接按定义公式计算,平均数的单位与观察值的单位相同。 2、频数资料(大样本) I.离散型数据 X:组值 f:频数 N:总频数 k:组数 平均每10个新生儿中,体重 超过3Kg的人数为 7 个。 II 连续型数据 其中 m:中值 f:频数 N:总数 k:组数 二、变异数 表示数据资料离中趋势和变异程度的统计数叫变异数。 (一)、变异数的意义和种类 1、极差 R R = max X - min X 应用实例: 品种

12、两个小麦品种的每穗小穗数 总和 平均 极差 甲 13 14 15 17 18 19 18 21 22 23 180 18 10 乙 16 16 17 18 18 18 19 20 20 18 180 18 4 说明乙的麦穗整齐 选择一个共同比较的标准: 由于: 又由于: 离均差的平方和,以SS表示。 若一个样本有3个数据,SS = 20; 又有一个样本有30个数据,SS = 20; 显然后一个样本的变异小,为了考虑这种差异,将 且数据越分散,离均差的平方和越大。 2、方差 将各个离均差平方求和,所得数值称离均差的平方 和,缩写为SS,平方和除以自由度的商值为方差。 3、标准差 方差的平方根就是

13、标准差,以 s 表示。 4、变异系数 CV 两个小麦主茎高度的测量结果 品种 平均数cm 标准差cm 变异系数% 甲 95.0 9.02 9.5 乙 75.0 8.5 11.3 (二)、标准差的计算方法和特性 1、非频数资料 按计算公式计算: 试证明: 2、频数资料的计算 I 离散型数据 II 连续型数据 S=1.30人 S=4.85cm 3、标准差的特性及作用 标准差的大小受多个观察值的影响,如果观察 值间的差异较大,其离均差也大,因而标准差也 大,反之亦反。 在计算标准差时,对各观察值加上或减去一个 常数,其标准差不变。如果给各观察值乘或除以 一个常数 a,则所得的标准差扩大或缩小了a倍。

14、 在正态布情况下,一个样本变量的分布情况可作 如下 估计:在 的范围内,将包含全部 观察值个数的68.27%,在 的范围内, 将包含全部观察值的95.45%,在 的范围 内,将包含全部观察值个数的99.73%。 标准差表示数据资料的离散程度,标准差小,说 明数据资料比较集中在平均数附近;标准差大,则 表明数据比较分散。 数 据 整 理 什么是数量性状?其数据的特点是什么? 什么是质量性状?在生物统计学里如何研究质量形 状? 什么是频数表(图)?研究频数(图)分布的意义 ? 平均数和变异数的意义与种类?算术平均数的基本 特征是什么? 试证明“离均差的代数和为零”和“离均差的平方 和最小”。 什么是加权平均数?如何计算加权平均数?

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号