次数分布和平均数、变异数

资源描述

《次数分布和平均数、变异数》由会员分享，可在线阅读，更多相关《次数分布和平均数、变异数（158页珍藏版）》请在金锄头文库上搜索。

1、第三章次数分布和平均数、变异数第一节总体及其样本第二节次数分布第三节平均数第四节变异数第五节理论总体(群体)的平均数和标准差第一节总体及其样本l 总体( population ) - 具有共同性质的个体所组成的集团.有限总体-总体所包含的个体数目有无穷多个 .无限总体-由有限个个体构成的总体.l 观察值( observation ) -每一个体的某一性状、特性的测定数值.l 变数( variable ) -观察值集合起来，称为总体的变数。变数又称为随机变数(random variable)。 l样本( sample ) -从总体中抽取若干个个体的集合称为样本(sample)。l统

2、计数( statistic ) -测定样本中的各个体而得的样本特征数，如平均数等，称为统计数(statistic)。l随机样本( random sample ) -从总体中随机抽取的样本称为随机样本(random sample) l样本容量 ( sample size ) -样本中包含的个体数称为样本容量或样本含量(sample size) 第二节次数分布一、试验资料的性质与分类二、次数分布表三、次数分布图一、试验资料的性质与分类(一) 数量性状资料(二) 质量性状资料(一) 数量性状资料数量性状(quantitative trait)的度量有计数和量测两种方式，其所得变数不同。1. 不连续

3、性或间断性变数( discontinuous or discrete variable ) 指用计数方法获得的数据。2. 连续性变数( continuous variable ) 指称量、度量或测量方法所得到的数据，其各个观察值并不限于整数，在两个数值之间可以有微量数值差异的第三个数值存在。 (二) 质量性状资料质量性状( qualitative trait )指能观察而不能量测的状即属性性状，如花药、子粒、颖壳等器官的颜色、芒的有无、绒毛的有无等。要从这类性状获得数量资料，可采用下列两种方法：1. 统计次数法于一定总体或样本内，统计其具有某个性状的个体数目及具有不同性状的个体数目，按类别计

4、其次数或相对次数。 2. 给分法给予每类性状以相对数量的方法二、次数分布表(一) 间断性变数资料的整理(二) 连续性变数资料的整理(三) 属性变数资料的整理(一) 间断性变数资料的整理现以某小麦品种的每穗小穗数为例，随机采取100个麦穗，计数每穗小穗数，未加整理的资料列成表3.1。表3.1 100个麦穗的每穗小穗数181517191615201819171718171618201917161817161719181817171718181516181818172019181719151717171617181817191917191718161817171916161717171517161

5、81918181919201716191817182019161819171615161817181717161917每穗小穗数 ( y )次数( f )1561615173218251917205总总次数( n )100表3.2 100个麦穗每穗小穗数的次数分布表从表3.2中看到，一堆杂乱的原始资料表3.1，经初步整理后，就可了解资料的大致情况，另外，经过整理的资料也便于进一步的分析。上述资料为间断性变数资料，每穗小穗数在1520的范围内变动，把所有观察值按每穗小穗数多少加以归类，共分为6组，组与组间相差为1小穗，称为组距。这样可得表3.2形式的次数分布表。(二) 连续性变数资料的整理兹以

6、表3.4的100行水稻试验的产量为例，说明整理方法。177 215 197 97123 159 245 119 119 131 149 152 167 104161 214 125 175 219 118 192 176 175 95136 199 116 165214 9515883137 80138 151 187 126 196 134 206 13798 97129 143 179 174 159 165 136 108 101 141 148 168163 176 102 194 145 173 75130 149 150 161 155 111 158131 189 91142 1

7、40 154 152 163 123 205 149 155 131 209183 97119 181 149 187 131 215 111 186 118 150 155 197116 254 239 160 172 179 151 198 124 179 135 184 168 169173 181 188 211 197 175 122 151 171 166 175 143 190 213192 231 163 159 158 159 177 147 194 227 141 169 124 159表3.4 140行水稻产量(单位：克)具体步骤：1. 数据排序(sort) 首先对数据按

8、从小到大排列(升序)或从大到小排列(降序)。2. 求极差(range) 所有数据中的最大观察值和最小观察值的差数，称为极差，亦即整个样本的变异幅度。从表3.4中查到最大观察值为254g，最小观察值为75g，极差为25475=179g。3. 确定组数和组距( class interval ) 根据极差分为若干组，每组的距离相等，称为组距。在确定组数和组距时应考虑：(1)观察值个数的多少；(2)极差的大小；(3)便于计算；(4)能反映出资料的真实面貌等方面。样本大小(即样本内包含观察值的个数的多少)与组数多少的关系可参照表3.5来确定。表3.5 样本容量与组数多少的关系样本内观察值的个数分组时

9、的组数 50 510 100 816 2001020 3001224 5001530 10002040组数确定后，还须确定组距。组距=极差/组数。以表3.4中140行水稻产量为例，样本内观察值的个数为140，查表3.5可分为816组，假定分为12组，则组距为179/12=14.9g，为分组方便起见，可以15g作为组距。4. 选定组限( class limit )和组中点值( 组值，class value ) 以表3.4中140行水稻产量为例，选定第一组的中点值为75g，与最小观察值75g相等；则第二组的中点值为75+15=90g，余类推。各组的中点值选定后，就可以求得各组组限。每组有两个组

10、限，数值小的称为下限( lower limit )，数值大的称为上限( upper limit )。上述资料中，第一组的下限为该组中点值减去1/2组距，即75(15/2)=67.5g，上限为中点值加1/2组距，即75+(15/2)=82.5g。故第一组的组限为67.582.5g。按照此法计算其余各组的组限，就可写出分组数列。5. 把原始资料的各个观察值按分组数列的各组组限归组可按原始资料中各观察值的次序，逐个把数值归于各组。待全部观察值归组后，即可求得各组的次数，制成一个次数分布表。例如表3.4中第一个观察值177应归于表3.6中第8组，组限为172.5187.5；第二个观察值149应归

11、于第6组，组限为142.5157.5；。依次把140个观察值都进行归组，即可制成140行水稻产量的次数分布表(表3.6)。表3.6 140行水稻的次数分布组组限中点值值( y )次数( f )67.5 82.575282.5 97.590797.5112.51057 112.5127.512013 127.5142.513517 142.5157.515020 157.5172.516525 172.5187.518021 187.5202.519513 202.5217.52109 217.5232.52253 232.5247.52402 247.5262.52551 合计计( n )1

12、40注：前面提到分为12组，但由于第一组的中点值接近于最小观察值，故第一组的下限小于最小观察值，实际上差不多增加了1/2组；这样也使最后一组的中点值接近于最大值，又增加了1/2组，故实际的组数比原来确定的要多一个组，为13组。 (三) 属性变数资料的整理属性变数的资料，也可以用类似次数分布的方法来整理。在整理前，把资料按各种质量性状进行分类，分类数等于组数，然后根据各个体在质量属性上的具体表现，分别归入相应的组中，即可得到属性分布的规律性认识。例如，某水稻杂种第二代植株米粒性状的分离情况，归于表3.7。表3.7 水稻杂种二代植株米粒性状的分离情况属性分组组( y )次数( f ) 红红米非

13、糯96 红红米糯稻37 白米非糯31 白米糯稻15 合计计( n )179三、次数分布图(一) 方柱形图(二) 多边形图(三) 条形图 (四) 饼图 (一) 方柱形图方柱形图( histogram )适用于表示连续性变数的次数分布。现以表3.6的140行水稻产量的次数分布表为例加以说明。即成方柱形次数分布图3.1。图3.1 140行水稻产量次数分布方柱形图(二) 多边形图多边形图( polygon )也是表示连续性变数资料的一种普通的方法，且在同一图上可比较两组以上的资料。仍以140行水稻产量次数分布为例，所成图形即为次数多边形图(图3.2)。图3.2 140行水稻产量次数分布多边形图(三)

14、条形图条形图(bar)适用于间断性变数和属性变数资料，用以表示这些变数的次数分布状况。一般其横轴标出间断的中点值或分类性状，纵轴标出次数。现以表3.7水稻杂种第二代米粒性状的分离情况为例，可画成水稻杂种第二代植株4种米粒性状分离情况条形图(3.3)。图3.3 水稻F2代米粒性状分离条形图(四) 饼图饼图( pie )适用于间断性变数和属性变数资料，用以表示这些变数中各种属性或各种间断性数据观察值在总观察个数中的百分比。如图3.4中白米糯稻在F2群体中占8%，白米非糯、红米糯稻和红米非糯分别占17%、21%和54%。图3.4 水稻F2代米粒性状分离的饼图第三节平均数一、平均数的意义和种类二

15、、算术平均数的计算方法三、算术平均数的重要特性四、总体平均数一、平均数的意义和种类平均数的意义:平均数( average )是数据的代表值，表示资料中观察值的中心位置，并且可作为资料的代表而与另一组资料相比较，借以明确二者之间相差的情况。平均数的种类 :(1) 算术平均数一个数量资料中各个观察值的总和除以观察值个数所得的商数，称为算术平均数( arithmetic mean )，记作。因其应用广泛，常简称平均数或均数(mean)。均数的大小决定于样本的各观察值。(2) 中数将资料内所有观察值从大到小排序，居中间位置的观察值称为中数( median )，计作Md。如观察值个数为偶数，则以中

16、间二个观察值的算术平均数为中数。(3) 众数资料中最常见的一数，或次数最多一组的中点值，称为众数( mode )，计作MO。如棉花纤维检验时所用的主体长度即为众数。(4) 几何平均数如有n个观察值，其相乘积开n次方，即为几何平均数( geometric mean )，用G代表。(31) 平均数的种类 :二、算术平均数的计算方法若样本较小，即资料包含的观察值个数不多，可直接计算平均数。设一个含有n个观察值的样本，其各个观察值为y1、y2、y3、yn，则算术平均数由下式算得：(32)若样本较大，且已进行了分组(如表3.6)，可采用加权法计算算术平均数，即用组中点值代表该组出现的观测值以计算平均数，其公式为(33) 其中yi 为第i 组中点值，fi 为第 i 组变数出现次数。例3.1 在水稻品种比较试验中，湘矮早四号的5个小区产量分别为20.0、19.0、21.0、17.5、18.5kg，求该品种的小区平均产量。例3.2

展开阅读全文