生物统计学1ppt课件

上传人:hs****ma 文档编号:568845975 上传时间:2024-07-27 格式:PPT 页数:40 大小:517KB
返回 下载 相关 举报
生物统计学1ppt课件_第1页
第1页 / 共40页
生物统计学1ppt课件_第2页
第2页 / 共40页
生物统计学1ppt课件_第3页
第3页 / 共40页
生物统计学1ppt课件_第4页
第4页 / 共40页
生物统计学1ppt课件_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《生物统计学1ppt课件》由会员分享,可在线阅读,更多相关《生物统计学1ppt课件(40页珍藏版)》请在金锄头文库上搜索。

1、第二章次数分布和平均数、变异数2.1 总体及其体及其样本本总体体(population):(population):具有一具有一样性性质的个的个体体组成的集成的集团。无限无限总体体(infinite population)(infinite population):总体体中包含的个体数目有无中包含的个体数目有无穷多个,多个,这种种总体称体称为无限无限总体。体。有限有限总体体(finite population)(finite population):总体中包含体中包含的个体数目有限,的个体数目有限,这种种总体称体称为有限有限总体。体。察看察看值(observation)(observation

2、):每一个体的某一个:每一个体的某一个性状、特性的性状、特性的测定数定数值叫做察看叫做察看值。变数数(variable)(variable):察看:察看值集合起来,称集合起来,称为变数。数。变量量(variate)(variate):变数中每一成数中每一成员称称为变量。量。例如:例如:测定定8 8个人的身高,得到以下数据:个人的身高,得到以下数据:160160、167167、175175、180180、158158、169169、173173、170170、察看值变数参数参数(parameter)(parameter):由:由总体的全部察看体的全部察看值而而算得的算得的总体特征数,如体特征数,

3、如总体平均数,称体平均数,称为参数。参数。样本本(sample)(sample):从:从总体中抽出的一部分个体体中抽出的一部分个体的集合。的集合。统计数数(statistic)(statistic):测定定样本中的各个体而得本中的各个体而得到的到的样本特征数,如平均数。本特征数,如平均数。估估计值(estimate)(estimate):统计数是数是总体相体相应参数参数的估的估计值。随机随机样本本(random sample)(random sample):从:从总体中随机体中随机抽取的抽取的样本。本。样本容量本容量(sample size)(sample size):样本中包含的个体本中包含

4、的个体数,用数,用n n表示。表示。2.2 次数分布次数分布2.2.1 2.2.1 实验资实验资料的性料的性料的性料的性质质与分与分与分与分类类2.2.2 2.2.2 次数分布表次数分布表次数分布表次数分布表2.2.3 2.2.3 次数分布次数分布次数分布次数分布图图2.2.1 实验资料的性质与分类实验资料的性质与分类一、数量性状资料数量性状(quantitative trait):的度量有计数与量测两种方式。1、不延续或延续性变数(discontinuous or discrete variable):指用计数方法获得的数据。2、延续性变数(continuous variable):指称量、

5、度量或丈量方法得到的数据。二、质量性状资料质量性状(qualitative trait):指能察看而不能量测的性状。1、统计次数法2、给予每类性状以相对数量的方法。2.2.2 次数分布表次数分布表一、延续性变数资料的整理1、100个麦穗每穗小穗数的次数分布表每穗小穗数(y)次数(f)总次数(n)10015161718192061532251752、200个稻穗每穗粒数的次数分布表次数(f)每穗粒数(y)合计3135263036404145465051555660616566707175768081853110213241382516832200二、延续性变数资料的整理以140行水稻实验的产量为

6、例P381、数据排序(sort)2、求极差(range) R=Max(1n)Min (1n)本例中:R25475179g3、确定组数和组距(class interval)组距R/组数因此必需先确定组数。组数确实定,可参照以下的要素:1察看值个数的多少;2极差的大小;3便于计算;4能反响出资料的真实容颜。样本大小与组数多少的关系可参照教材表3.5(P38)本例,察看值的个数为140,可分816组,假定分为12组,那么组距179/1214.9,为方便起见,组距定为15g。4、选定组限(class limit)和组中点值(组值,class value)首先选定第一组的中点值,这一点选定后,那么该组组

7、限确定,其他各组的中点值和组限也随之确定。第一组的中点值以最接近最小察看值为好,这样可以防止第一组内次数过多,能正确地反映资料的规律性。例中,选定第一组的中点值为75g,那么第二点的中点值为751590g,余类推。每组有两个组限,数值小的为下限(lower limit),数值大的为上限(upper limit)。第一组的下限为该组中点值减1/2组距,即7515/2)=67.5g,上限为中点值加1/2组距,即7515/2)=82.5g。故第一组的组限为76.582.5。按照此法计算出其他各组的组限,就可写出分组数列。5、察看值按分组数列的各组组限归组。140行水稻产量的次数分布次数(f)中点值(

8、y)组限759010512015016018019521022524025567.582.582.597.597.5112.5112.5127.5127.5142.5142.5157.5157.5172.5172.5187.5187.5202.5202.5217.5217.5232.5232.5247.5247.5262.52771317202521139321合计(n)140三、属性变数资料的整理把资料按各种质量性状进展分类,分类数等于组数,然后根据各个体在质量属性上的详细表现,分别归入相应的组中,即可得到属性分布的规律性认识。下表是某水稻杂种二代植株米粒的分别情况:次数(f)属性分组(y)

9、红米非糯红米糯稻白米非糯白米糯稻96373115合计(n)1792.2.3 次数分布图次数分布图一、方柱形图方柱形图(histogram)适用于表示延续性变数的次数分布。横轴为分组数列,纵轴为分布次数。横坐标与纵坐标的长度要有适宜的比例(普通为5:4或6:5为好),绘成的图形才干明显阐明次数分布情况。140行水稻产量次数分布方柱形图fy(产量,g/行)二、多边形图多边形图(polygon),以每组中点值为横坐标,以次数为纵坐标。三、条形图条形图(bar diagram)适用于延续性变数和属性变数资料。普通横坐标表示延续的中点值或分类性状,纵坐标表示次数。四、饼图饼图(pie diagram)适

10、用于延续性和属性资料,用以表示这些变数中各种属性或各种延续性数据察看值在总察看值个数中的百分比。2.3 平均数平均数2.3.1 2.3.1 平均数的意平均数的意平均数的意平均数的意义义和种和种和种和种类类2.3.2 2.3.2 算算算算术术平均数的平均数的平均数的平均数的计计算方法算方法算方法算方法2.3.3 2.3.3 算算算算术术平均数的重要特性平均数的重要特性平均数的重要特性平均数的重要特性2.3.4 2.3.4 总总体平均数体平均数体平均数体平均数2.3.1 平均数的意义和种类平均数的意义和种类一、平均数的意义平均数(average)是数据的代表性,表示资料中察看值的中心位置,并且可以

11、资料的代表而于另一组资料相比较,借以明确两者之间相差的情况。二、平均数的种类1、算术平均数(arithmetic mean):一个数量资料中各个察看值的总和除以察看值的个数所得的商,记作2、中数(median):将资料内一切察看值从大到小陈列,居中间位置的察看值称为中数,记作Md例如: 1、2、3、4、5中数是3 1、2、3、4、5、6中数是: (3+4)/2=3.53、众数(mode):资料中最常见的一数,或次数最多一组的中点值,称为众数,记为Mo。例如:在资料23、24、23、22、23、25、20、23、中 Mo234、几何平均数(geometric mean):n个察看值,其乘积开n次

12、方,即为几何平均数,用G代表。2.3.2 算术平均数的计算方法算术平均数的计算方法1、直接以察看值进展计算2、假设样本较大,且已分组,可采用加权法计算算术平均数,即以组中值代表该组出现的察看值以计算平均数。利用140行水稻产量资料计算每行平均产量假设采用直接法进展计算,平均数等于157.47。因此,两者的结果非常接近。2.3.3 算术平均数的重要特性算术平均数的重要特性1、样本各察看值与其平均数的差数简称离均差,deviation from mean)的总和为0。即:2、样本各察看值与其平均数的差数平方总和,较各个察看值与恣意其它数值的差数平方的总和为小,亦即离均差平方的总和最小。2.3.4

13、总体平均数总体平均数总体平均数用来表示,其计算公式为:从公式中可以看出,除非是有限总体,否那么总体平均数是无法经过计算得到的。2.4 变异数异数2.4.1 2.4.1 极差极差极差极差2.4.2 2.4.2 方差方差方差方差2.4.3 2.4.3 规规范差范差范差范差2.4.4 2.4.4 变变异系数异系数异系数异系数代表值只是反映了数值资料的一个方面集中程度的特征,资料的另一方面和的特征是变异程度。请看下面的例子:A组资料:3、4、5、6、7 平均数为:5B组资料:1、3、5、7、9 平均数仍为:5这里的平均数5对于A组资料的代表性好?还是对于B组资料的代表性好?答案是非常清楚的。可见,只阐

14、明了数据的集中程度是远远不够的,还需求进一步阐明数据的变异程度。只需经过变异程度的描画,才知道代表值的代表性。表示数据变异特征的数值叫变异数。常用的变异数有:极差、方差、规范差、变异系数等。2.4.1 极差极差极差极差(range),(range),又称全距,又称全距,记为R R,是,是资料中最大料中最大值与最小与最小值之差。之差。例如:例如:A A组资料的极差料的极差RARA7 73 34 4B B组资料的极差料的极差RBRB9 91 18 8极差的极差的计算算简单,但是它只是两个极端数据决,但是它只是两个极端数据决议的,没有地方充分利用的,没有地方充分利用资料的全部信息,而且料的全部信息,

15、而且易于遭到易于遭到资料中不正常的极端料中不正常的极端值的影响。所以的影响。所以用它来代表整个用它来代表整个样本的本的变异度是有缺陷的。异度是有缺陷的。2.4.2 方差方差由于算术平均数的可信度比较高,我们想象用察看值与算术平均数之间的差别来度量一组察看值的变异性,但是这又遇到 的困难。为理处理这一矛盾,将离均差平方后再相加就不再为0。从这个式子知道 愈大,那么资料的变异程度也就愈大。 称为离均差的平方和简称平方和,记为SSSum Of Square)。样本的平方和为总体的平方和为由于各个样本所包含的察看值数目不同,为便于比较,用察看值数目除平方和,得到平均平方和,简称均方(mean squa

16、re)或方差(variance)。样本均方用s2表示,定义为:它是总体方差(2)无偏估计值。2.3.3 规范差规范差一、一、规范差的定范差的定义规范差是方差的正平方根范差是方差的正平方根值,用以表示,用以表示资料料的的变异度,其异度,其单位与察看位与察看值的度量的度量单位一位一样。样本本规范差的范差的计算公式算公式为:总体规范差用表示:二、自在度的意义二、自在度的意义自在度自在度(degree of freedom)(degree of freedom)最早是一个物最早是一个物理学上的名词,它表示一个质点在空间理学上的名词,它表示一个质点在空间运动的自在程度。统计学借此来反映一运动的自在程度。

17、统计学借此来反映一批变量的约束条件。批变量的约束条件。例如一个有例如一个有5 5个察看值的样本,由于遭到统个察看值的样本,由于遭到统计数的约束,在计数的约束,在5 5个离均差中,只需个离均差中,只需4 4个数值可以在一定范围内自在变动取值,个数值可以在一定范围内自在变动取值,而第五个离均差必需满足而第五个离均差必需满足 这一这一限制条件。限制条件。自在度记作DF,详细数值用表示普通,样本自在度等于察看值个数(n)减去约束条件的个数(k),即 n k。2.3.4 变异系数变异系数假设比较两个样本的变异度,那么因单位不同或平均数不同,不能用规范差直接比较。这时要构造一个不代单位,不受平均数大小影响的变异数,这就是变异系数(coefficient of variation),用CV表示。两个小麦种类株高变异的比较种类平均数(cm)S(cm)变异系数CV(%)甲95.09.02乙75.08.509.511.3

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号