实验与统计 (3)

上传人:mg****85 文档编号:50610734 上传时间:2018-08-09 格式:PPT 页数:65 大小:338KB
返回 下载 相关 举报
实验与统计 (3)_第1页
第1页 / 共65页
实验与统计 (3)_第2页
第2页 / 共65页
实验与统计 (3)_第3页
第3页 / 共65页
实验与统计 (3)_第4页
第4页 / 共65页
实验与统计 (3)_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《实验与统计 (3)》由会员分享,可在线阅读,更多相关《实验与统计 (3)(65页珍藏版)》请在金锄头文库上搜索。

1、第三章 次数分布和平均数、变异数第一节 总体及其样本第二节 次数分布第三节 平均数第四节 变异数第五节 理论总体(群体)的平均数和标准差复 习 1、生物统计学的定义 2、生物统计学的主要内容 3、生物统计学的几个术语今天学习的主要内容 1、几个新的生物统计学名词 2、资料的分类 3、计量资料的整理 4、计数资料的整理 5、次数分布表和次数分布图的制作与用途第一节 总体及其样本l 总体( population ) - 具有共同性质的个体所组成的集团.有限总体-总体所包含的个体数目有无穷多个 .无限总体-由有限个个体构成的总体.l 观察值( observation ) -每一个体的某一性状、特性的

2、测定数值.l 变数( variable ) -观察值集合起来,称为总体的变数。在生物统计学中,变数又称为随机变数(random variable)。 l样本( sample ) -从总体中抽取若干个个体的集合称为样本(sample)。l随机样本( random sample ) -从总体中随机抽取的样本称为随机样本(random sample) l样本容量 ( sample size ) -样本中包含的个体数称为样本容量或样本含量(sample size) l统计数与参数( statistic ) -测定样本中的各个体而得的样本特征数,如平均数等,称为统计数(statistic)。测定总体中的

3、各个体而得的样本特征数称为参数。第二节 次数分布一、试验资料的性质与分类二、次数分布表三、次数分布图一、试验资料的性质与分类(一) 数量性状资料(二) 质量性状资料(一) 数量性状资料(quantitative trait)数量性状的度量有计数和计量两种方式,所得变数不同1. 计数资料(也称为不连续性或间断性资料) 指用计数方法获得的数据。2.计量资料(连续性资料)指用度量衡工具直接测定获得的资料 ( continuous variable ) ,其各个观察值并不限于整数,在两个数值之间可以有微量数值差异的第三个数值存在。统计学中资料也称为变数,所以计量资料也叫连续性变数;计数资料也称为不连续

4、性或间断性资料。(二) 质量性状资料质量性状( qualitative trait )指能观察而不能量测的状即属性性状,如花药、子粒、颖壳等器官的颜色、芒的有无、绒毛的有无等。要从这类性状获得数量资料,可采用下列两种方法:1. 统计次数法 于一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别计其次数或相对次数。 2. 给分法 给予每类性状以相对数量的方法二、次数分布表(一) 间断性变数资料的整理(二) 连续性变数资料的整理(三) 属性变数资料的整理(一) 间断性变数资料的整理现以某小麦品种的每穗小穗数为例,随机采取100个麦穗,计数每穗小穗数,未加整理的资料列成表3

5、.1。表3.1 100个麦穗的每穗小穗数18151719161520181917171817161820191716181716171918181717171818151618181817201918171915171717161718181719191719171816181717191616171717151716181918181919201716191817182019161819171615161817181717161917每穗小穗数 ( y )次数( f )1561615173218251917205总总次数( n )100表3.2 100个麦穗每穗小 穗数的次数分布表从表3.2

6、中看到,一堆杂乱的原始资料表3.1,经初步整理后,就可了解资料的大致情况,另外,经过整理的资料也便于进一步的分析。上述资料为间断性变数资料,每穗小穗数在1520的范围内变动,把所有观察值按每穗小穗数多少加以归类,共分为6组,组与组间相差为1小穗,称为组距。这样可得表3.2形式的次数分布表。(二) 连续性变数资料的整理以表3.4的100行水稻试验的产量为例,说明整理方法。177 215 197 97123 159 245 119 119 131 149 152 167 104161 214 125 175 219 118 192 176 175 95136 199 116 165214 9515

7、883137 80138 151 187 126 196 134 206 13798 97129 143 179 174 159 165 136 108 101 141 148 168163 176 102 194 145 173 75130 149 150 161 155 111 158131 189 91142 140 154 152 163 123 205 149 155 131 209183 97119 181 149 187 131 215 111 186 118 150 155 197116 254 239 160 172 179 151 198 124 179 135 184 1

8、68 169173 181 188 211 197 175 122 151 171 166 175 143 190 213192 231 163 159 158 159 177 147 194 227 141 169 124 159表3.4 140行水稻产量 (单位:克)具体步骤:1. 数据排序(sort) 首先对数据按从小到大排列(升序)或从大到小排列(降序)。2. 求极差(range) 所有数据中的最大观察值和最小观察值的差数,称为极差,(极差也叫全距)是整个样本的变异幅度。从表3.4中查到最大观察值为254g,最小观察值为75g,极差为25475=179g。3. 确定组数和组距( cla

9、ss interval ) 根据极差分为若干组,每组的距离相等,称为组距。 在确定组数和组距时应考虑:(1)观察值个数的多少;(2)极差的大小;(3)便于计算;(4)能反映出资料的真实面貌等方面。样本大小(即样本内包含观察值的个数的多少)与组数多少的关系可参照表3.5来确定。表3.5 样本容量与组数多少的关系样本内观察值的个数分组时 的组 数 50 510 100 816 2001020 3001224 5001530 10002040组数确定后,还须确定组距。组距=极差/组数。以表3.4中140行水稻产量为例,样本内观察值的个数为140,查表3.5可分为816组,假定分为12组,则组距为17

10、9/12=14.9g,为分组方便起见,可以15g作为组距。4. 选定组限( class limit )确定组中值( class value ) 以表3.4中140行水稻产量为例,选定第一组的中点值为75g,与最小观察值75g相等;则第二组的中点值为75+15=90g,余类推。 各组的中点值选定后,就可以求得各组组限。每组有两个组限,数值小的称为下限( lower limit ),数值大的称为上限( upper limit )。上述资料中,第一组的下限为该组中点值减去1/2组距,即75(15/2)=67.5g,上限为中点值加1/2组距,即75+(15/2)=82.5g。故第一组的组限为67.58

11、2.5g。按照此法计算其余各组的组限,就可写出分组数列。5. 归组 即把原始资料的各个观察值按分组数列的各组组限归组 可按原始资料中各观察值的次序,逐个把数值归于各组。 待全部观察值归组后,即可求得各组的次数,制成一个次数分布表。 例如表3.4中第一个观察值177应归于表3.6中第8组,组限为172.5187.5;第二个观察值149应归于第6组,组限为142.5157.5;。依次把140个观察值都进行归组,即可制成140行水稻产量的次数分布表(表3.6)。表3.6 140行水稻的次数分布组组 限组组中值值( y )次数( f )67.5 82.575282.5 97.590797.5112.5

12、1057 112.5127.512013 127.5142.513517 142.5157.515020 157.5172.516525 172.5187.518021 187.5202.519513 202.5217.52109 217.5232.52253 232.5247.52402 247.5262.52551 合计计( n )140注:前面提到分为12组,但由于第一组的中点值接近于最小观察值,故第一组的下限小于最小观察值,实际上差不多增加了1/2组;这样也使最后一组的中点值接近于最大值,又增加了1/2组,故实际的组数比原来确定的要多一个组,为13组。 (三) 属性变数资料的整理属性变

13、数的资料,也可以用类似次数分布的方法来整理。 在整理前,把资料按各种质量性状进行分类,分类数等于组数, 然后根据各个体在质量属性上的具体表现,分别归入相应的组中,即可得到属性分布的规律性认识。例如,某水稻杂种第二代植株米粒性状的分离情况,归于表3.7。表3.7 水稻杂种二代植株米粒性状的分离情况属性分组组( y )次数( f ) 红红米非糯96 红红米糯稻37 白米非糯31 白米糯稻15 合计计( n )179三、次数分布图(一) 方柱形图(二) 多边形图(三) 条形图 (四) 饼图 (一) 方柱形图方柱形图( histogram )适用于表示连续性变数的次数分布。现以表3.6的140行水稻产

14、量的次数分布表为例加以说明。即成方柱形次数分布图3.1。图3.1 140行水稻产量次数分布方柱形图(二) 多边形图多边形图( polygon )也是表示连续性变数资料的一种普通的方法,且在同一图上可比较两组以上的资料。仍以140行水稻产量次数分布为例,所成图形即为次数多边形图(图3.2)。(注意:横轴的数字与方柱形图的区别)图3.2 140行水稻产量次数分布多边形图(三) 条形图 条形图(bar)适用于间断性变数和属性变数资料,用以表示这些变数的次数分布状况。一般其横轴标出间断的中点值或分类性状,纵轴标出次数。现以表3.7水稻杂种第二代米粒性状的分离情况为例,可画成水稻杂种第二代植株4种米粒性

15、状分离情况条形图(3.3)。图3.3 水稻F2代米粒性状分离条形图(四) 饼图 饼图( pie )适用于间断性变数和属性变数资料,用以表示这些变数中各种属性或各种间断性数据观察值在总观察个数中的百分比。如图3.4中白米糯稻在F2群体中占8%,白米非糯、红米糯稻和红米非糯分别占17%、21%和54%。图3.4 水稻F2代米粒性状分离的饼图频率分布 在第一章我们了解了频率与概率,一个样本资 料我们可以通过次数分布计算出它的频率分布.再 通过频率分布估计该样本所在总体的概率分布。 如通过140行水稻的次数分布表计算它的频率分 布表,再根据它的频率分布表推断出该品种水稻 产量在112.5-202.5的概率是多少? 在工作中我们遇到的问题基本上都是由样本去 推断总体的情况。140行水稻的频率分布表组组 限 组组中值值( y ) 次数( f ) 频频率 累计频计频 率67.5 82.5752 0.0 14 0.01482.5 97.5907 0.051 0.0 65 97.5112.51057 0.051 0.116 112.5127.512013 0.093 0.209 127.5142

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号