生物统计学教案(一)

上传人:小** 文档编号:58885885 上传时间:2018-11-02 格式:DOC 页数:11 大小:263.52KB
返回 下载 相关 举报
生物统计学教案(一)_第1页
第1页 / 共11页
生物统计学教案(一)_第2页
第2页 / 共11页
生物统计学教案(一)_第3页
第3页 / 共11页
生物统计学教案(一)_第4页
第4页 / 共11页
生物统计学教案(一)_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《生物统计学教案(一)》由会员分享,可在线阅读,更多相关《生物统计学教案(一)(11页珍藏版)》请在金锄头文库上搜索。

1、7生物统计学生物统计学教案教案第一章 统计数据的收集和整理教学时间:2 学时教学方法:课堂板书讲授教学目的:重点掌握样本特征数平均数、样本方差、标准差的概念和计算方法,掌握数据类型及频数(率)分布,了解众数、中位数、变异系数。讲授难点:样本方差、标准差的概念和计算方法1.1 总体与样本1.1.1 统计数据的不齐性1、变异性是自然界存在的客观规律。2、自然界如果没有变异,也就不需要统计学了。3、生物学研究的对象都是很大的群体,不可能研究全部对象,只能通过研究其中的一部分,来推断全部对象,于是引出以下概念。1.1.2 总体与样本总体:研究的全部对象。个体:总体中的每个成员。样本:总体的一部分。样本

2、含量:样本所包含的个体数目。1.1.3 抽样抽样:从总体中获得样本的过程。随机抽样:总体中的每一个个体被抽中的机会都相同的一种抽样方法。放回式抽样:从总体中抽出一个个体,记下其特征后,放回原总体中,再做第二次抽样。非放回式抽样:从总体中抽出个体后,不再放回,即做第二次抽样。抽样的目的:从总体中获得一个有代表性的样本,以便通过样本推断总体。应注意的问题:样本必须有代表性。样本含量与可实施性之间的平衡。81.2 数据类型及频数(率)分布1.2.1 连续型数据和离散型数据连续型数据:与某种标准比较所得到的数据。又称为度量数据。离散型数据:由记录不同类别个体的数目所得到的数据。又称为计数数据。1.2.

3、2 频数(率)分布表和频数(率)分布图的编绘例 1.1 调查每天出生的 10 名新生儿中体重超过 3 公斤的人数, 共调查 120 天,结果如下:表 11 每 10 名新生儿中体重超过 3Kg 的人数的频数(率)分布表频数(率)分布:把频数(率)按组值的顺序排列起来,便得到离散型数据的频数(率)分布。频数(率)分布还可以用图形表示,见图 1-1。9图 11 每 10 名新生儿中体重超过 3Kg 的人数的频数分布图下面介绍连续型数据的频数(率)分布表和分布图的编绘方法。例 1.2 表 1-2 列出了高粱“三尺三”提纯时所调查的 100 个数据。表 12 “ 三尺三”株高测量结果155 153 1

4、59 155 150 159 157 159 151 152159 158 153 153 144 156 150 157 160 150150 150 160 156 160 155 160 151 157 155159 161 156 141 156 145 156 153 158 161157 149 153 153 155 162 154 152 162 155161 159 161 156 162 151 152 154 157 162158 155 153 151 157 156 153 147 158 155148 163 156 163 154 158 152 163 158

5、154164 155 156 158 164 148 164 154 157 165158 166 154 154 157 167 157 159 170 158从上表中除可以看出最大值为 170,最小值为 141,以及平均高度大约在150-160 之外,很难再看出什么规律出来。但将以上数据列成频数分布表以后,便可以清楚地看出数据的变化规律。表 13 “三尺三”株高频数(率)分布表频数(率)分布:把频数(率)按组界的顺序排列起来,便得到了连续型数10据的频数(率)分布。从频数分布表中可见到的规律性:1、植株矮的频数低,植株高的频数也低,植株中等高度的频数最高。2、频数分布基本是两侧对称的。3、

6、植株平均高度在 156-158 厘米范围内。编制连续型数据频数(率)分布表的要点:1、求出极差 R,R = max x min x,根据极差决定划分的组数,一般以10 15 组为宜。2、根据极差和组数求出组距,按照组距划分组限。组限是按实验记录数据划分的每一组的上下限。3、确定组界,组界是每一组实际值的上下界。4、计算中值,中值是每一组组限的平均值。5、以唱票的方式把原始数据添入相应的组限内,统计出每组的频数并计算出相应的频率。连续型数据的频率分布同样可以用频数(率)分布图表示。下面是频数(率)分布的直方图。图 12 “三尺三”株高直方图横轴表明组界,纵轴标明频数(率) ,以每一组的组界为一边

7、,相应的频数(率)为另一边,作成连续的矩形,构成直方图。11连续型数据的频数(率)分布还可以用多边形图表示。图 13 “三尺三”株高多边形图横轴为中值,纵轴为频数(率) ,标上各点,连接各点构成多边形图。第三种频数(率)图是累积频数图。首先编制出累积频数(率)表。再以横轴为中值,纵轴为频数(率)绘图。表 14 “三尺三”株高的累计频数分布表中值累积频数(率)中值累积频数(率)142 1157 71145 3160 86148 7163 96151 20166 99154 43169 100图 14 “三尺三”株高累计频数分布图121.2.3 研究频数(率)分布的意义1、可以描述数据的集中点,以

8、平均值表示。2、可以描述数据变异的情况。3、可以描述数据分布的形状。4、可以显示数据中的不规则的情况。1.2.4 频数(率)分布的不恒定性频数(率)分布是样本分布,由于不同次抽样的随机误差,造成样本间的波动。见下例。表 1-5 每 10 名行人中男性人数分布表样本 1样本 2男性人数频数男性人数频数0 1 0 01 2 1 12 9 2 63 17 3 184 27 4 255 46 5 406 29 6 307 12 7 208 4 8 99 3 9 110 0 10 0总计 150 总计 1501.3 样本的几个特征数样本特征数:描述样本分布特征的数字。如,平均数、标准差、偏斜度和峭度。1

9、.3.1 平均数13我们在这里使用的是算术平均数,以后一律简称为平均数。平均数以表x示,读作“x杠”或“杠x” 。计算公式如下:nxnxxxxnii n 121(1.1)第二种平均数称为中位数,中位数是有序数列中点位置上的数。第三种平均数是众数,所谓众数是指具有最高频数的组值或中值。1.3.2 平均数的计算方法1、非频数资料:非频数资料可以直接使用(1.1)式计算,不再举例。2、频数资料:计算离散型数据的频数资料时,可用下式:(1.2) Nfx xkii 1其中:x = 组值,f = 频数,N = 总频数,k = 组数以下计算例 1.1 的平均数。根据表 1 1 中的数据,列成下表。xffx0

10、 0 01 0 02 0 03 1 34 2 85 12 606 19 1147 39 2738 34 2729 10 9010 3 3014总计 120 850由公式(1.2)得 08.71208501 Nxf xkii每 10 名新生儿中,平均有 7 名体重超过 3 公斤。计算连续型数据的频数资料时,与离散型数据类似。只要用连续型数据的中值代替离散型数据的组值即可,这里不再举例。1.3.3 标准差可以用三个量来度量数据的离散程度。1、范围:又称为极差,它是一组数据的最大值与最小值的差。例如,以下 5 个数:96.4、96.6、97.2、97.4、97.8(ml) 。它们的范围(R)R =

11、97.8 96.4 = 1.4 ml优点:简单。缺点:只利用了一组数据的两个极端值,不能客观地反映一组数据中每一个数据与平均数的偏离程度。为了解决范围所存在的缺点,需要求出一组数据中的每一个数与平均数的离差,然后再对该离差进行平均,以其平均数反映数据的离散程度。2、平均离差:先看下表x ml离均差ml xx mlxx ml 2 2xx 96.6- 0.480.480.230497.2+0.120.120.014496.4- 0.680.680.462497.4+0.320.320.102497.8+0.720.720.51840897. x和=0和=2.32和=1.3280为了求得离均差的平均

12、数,首先要求离均差的和,从表中可见离均差的和15为 0。为了解决负数问题,求离均差绝对值的和,再以样本含量平均,从而得出平均离差(MD) 。mlnxxMD46405322. 3、标准差:解决负数的问题除取绝对值外,另一个办法是取离均差的平方。所有离均差的平方相加称为离差平方和。按习惯做法,应当用样本含量n平均,但在这里不用n而用n 1 平均,所得结果称为样本方差,记为s2。 1122 nxx snii(1.3)上例中的方差22332.0153280.1mls 方差的单位是原始数据的平方,为了使单位与原始数据相同,还必须对方差开方,开放后的方差称为标准差,记为s 。 112 nxx snii(1

13、.4)上例的标准差为mls576.0332.0 抽样理论证明,三种对总体离散程度估计的方法中,标准差估计得最可靠,以后我们一律使用标准差。1.3.4 标准差的计算方法1、非频数资料由 1.4 式计算标准差首先要计算出平均数,给计算带来一定的困难也影响结果的准确性。可将 1.4 式变为以下形式(1.5)11212 nnx x sniniii16例 1.3 计算以下数据的标准差:26 25 28 24 23 25 27 27 30 21。解 最好列成以下表格的形式计算 x2x26 67625 62528 78424 57623 52925 62527 72927 72930 90021 441和

14、256 6614将最后一行代入 1.5 式59.271.691025666142 s如果对上表中的数字进行编码,则计算更为简便。取 C=26。x 2x 0 0- 1 12 4- 2 4- 3 9- 1 11 11 1174 16- 5 25和 - 4 62将上表中的最后一行代入 1.5 式中,得s = 2.59。与未编码的结果一样。2、频数资料离散型数据可按下式计算(1.6) 11212 NNxf xf skikiii其中,f = 频数,x = 组值,N = 总频数,k = 组数。对于连续型数据,只需将 1.6 式中的组值x,改为中值m。一般m的值都较大,需对m进行编码后再计算。对于频数资料的计算不再举例,同学可用例 1.1 和例 1.2 的数据为例进行练习。1.3.6 变异系数标准差可以反映数据的离散程度,如果在两个样本之间进行比较,还要考虑标准差是在什么样的基础上进行的波动,即需要考虑两个样本平均数的大小。例如马和狗体重的标准差相同,那么谁更整齐呢?一定是马,因为马的体重远远大于狗。为此,引入变异系数(CV)这一概念

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号