生物数学第三章

上传人:人*** 文档编号:511596843 上传时间:2022-12-14 格式:DOC 页数:52 大小:984.50KB
返回 下载 相关 举报
生物数学第三章_第1页
第1页 / 共52页
生物数学第三章_第2页
第2页 / 共52页
生物数学第三章_第3页
第3页 / 共52页
生物数学第三章_第4页
第4页 / 共52页
生物数学第三章_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《生物数学第三章》由会员分享,可在线阅读,更多相关《生物数学第三章(52页珍藏版)》请在金锄头文库上搜索。

1、第三章 生物分类的数学模型本章开始将讨论生物分类,按照生物分类学家的理解就是指表征分类和分支分类, 我们仅研究两种分类概念下的数学理论与方法。这里的分类也是多元统计关于聚类分析的延续,但是已远远超出统计数学的范围。表征分类除经典的系统分类以外还包括图论分类、信息分类、模糊分类;分支分类是以抽象代数为基础,研究生物演化规律的分支学科。因此生物数学中的分类数学模型不能再视作多元统计中的聚类分析,而应称为分类分析。本章专门讨论分类分析中的表征分类数学模型。第一节 分类的基本概念和原始数据的获得何谓分类?有句俗话“物以类聚”,这句话的意思是说,许多事物依据其类别的特征,相似者归为同一种类。从这个意思去

2、理解,分类有两个要素。第一个要素是被分类的对象,分类对象是由许多被分类的实体所组成,3个以上的实体构成一个基本分类对象。被分类的实体,就是被分类的基本单位,在数量分类学中称为运算分类单位(operational taxonomic unit)简写作分类单位(OTU)。全部被分类的分类单位构成的集合称为被分类群。分类的第二个要素是分类的依据,分类依据取决于被类群中分类单位的性状,所谓性状(character)是一个分类单位区分于其他分类单位的性质、特征或属性。一个分类单位对某个性状所呈现的状态,称为该性状的性状状态(character state),简称状态(state)。分类就是将被分类群中所

3、有的分类单位,依据它们的性状状态,遵从一定的原则作出划分或聚合,得到一组新的分类单位集合。通过分类获得的这个分类单位集合称为分类群(taxon)。世界上一切事物都存在分类的问题。专门研究生物物种的分类,也就是生物分类学中的分类,有表征与分支两个对立的概念。依据生物表现性状相似性全面比较而建立的系统分类称为表征分类(phenetic classification);遵从生物演化的谱系关系而建立的系统分类称为分支分类(cladistic classification)。这两个概念在生物分类学和数量分类学中都很重要,相应的也有两种不同的数学方法,本章将要研究表征分类。分类单位隶属于一个分类群产生分类

4、单位与分类单位之间的联系。如果A是被考虑的一个分类群,又有分类单位xA,且分类单位yA,则认为x与y之间建立起同属于一个分类群的联系,称作分类单x与y共分类群,记作xy分类学家在分析比较鉴定被分类对象时,经常要问哪些分类单位属于同一分类群,生物分类工作时时刻刻都在考虑共分类群问题。显然共分类群这个联系成为分类学理论上最基本的概念之一。分类单位共分类群关系具有以下性质:性质1 自反性(reflexivity),即xx;性质2 对称性(symmetry),若xy,则yx;性质3 传递性(transitivity),若xy且yz,则xz。共分类群,就分类单位的隶属性关系来说,以上3条性质是十分必要的

5、,3条性质正是数学中的所谓等价关系(equivalence relation)。具有等价关系的集合,可以依据等价关系将集合分类,得等价集合类。这是集合论中的一个重要结论。数量分类学中的定量分类方法正是依靠数学中的这个结论去解决分类问题。等价关系下的等价集合类成为表征分类方法的理论根据。下面我们将开始讨论在表征分类观点下的数量分类方法。当被分类群一经确定,合适的性状也被挑选出来,生物学工作者就要对调查、观察、测量、实验得到的数据进行整理,获得有关分类单位和性状的原始记录。这些记录收集了来自各方面的信息,是从事分类工作的第一手资料。原始记录的形式尚不能直接进行数学运算。为了能够利用数学工具来从事分

6、类学的研究,必须将所有这些记录改变成适合于数学运算的形式。在数量分类学中这项工作叫做性状编码。性状编码的一般方法随性状的各种类型分别处理,现叙述如下:1. 数 值 性 状以整数或实数所表示的性状称为数值性状(numerical character)。例如生物形态的各种度量、长度、面积、体积、角度和重量等;生物组织器官各部分构成的数量;各种实验数据;各种仪器测量的数据以及基于上述性状而获得的导出性状。这些都是数值性状。数值性状本身已经是数值,它是天然的最适合于进行数量分类的性状,一般分类方法无须编码处理,就可以转入下一步进行数学运算。需要注意的是有些性状虽然以数值表示,但实质上不属于数值性状。2

7、. 二 元 性 状表现为对立面二种状态的性状称为二元性状(binary character)。例如动物是脊椎动物还是无脊椎动物,脊椎动物中是胎生还是卵生,冷血还是温血;有花植物的花冠是合瓣还是离瓣,子房是分离心皮还是合生心皮,果实开裂与否;在微生物学中二元性状尤其多,各种生理、生化、营养性状几乎都出现二元性状;生物地理学的调查资料中,生物种类在指定区域内的有或无也是二元性状。二元性状的编码很简单,将两个状态分别以“0”和“1”表示,通常肯定的状态为1,否定的性状为0。3. 有序多态性状表现为三个状态以上,能排列成一定次序,次序具有分类意义的性状称为有序多态性状(ordered multista

8、te character)。例如对器官某部分长度的描述是短、略长、长、极长;植物体表无毛、微具毛、具毛、多毛、密毛;植物地理学中某植物在某地区的分布调查是无、有、较多、极多。有序多态性状的状态个数一般都是有限的,由于是有序的,可以将其排列为一定的等级。编码时可以取连续排列的非负整数0, 1, 2, 3, , n,它们分别表示n + 1个有序多态性状状态。例如被毛的性状可编码如下:性状状态:无毛微具毛具毛多毛密毛编 码: 01234性状状态在不同方向上各自排列为有序的多态性状,不能按上面的编码方法处理。例如关于被毛的性状,如果毛有短毛、长毛,硬毛、柔毛,单一毛、二歧分支毛和多歧星状毛。这种情形属

9、于无序多态性状,可采取分解的方法编码。4. 无序多态性状表现在三个状态以上,不能排列成具有分类意义的一条序列的性状称为无序多态性状(disordered multistate character)。例如种子植物的花序有总状、头状、伞形、伞房、穗状;花冠的类型有唇形、蝶形、钟形、舌形;昆虫的口器有咀嚼式、针吸式、虹吸式、舐吸式;生物分布的地理区域也是无序多态性状。在微观世界蛋白质的氨基酸组成和核酸中的核苷酸构成都是无序多态性状。无序多态性状的编码比较复杂,有以下三种方法,叙述如下:4.1 分 解 法分解法就是将原性状分成多个新性状,再进行编码。有时候无序多态性状包含了多种互相独立的意义,实际上这

10、种性状不符合单位性状的要求,分解成多个相应的单位性状是应该的。例如植物被毛的种类,有短毛、长毛、硬毛、软毛、单一毛、二歧分支毛、多歧星状毛和腺毛等。这一无序多态性状具有多方面的意义,即毛的长短、毛的硬软、毛的分枝状况和毛端是否形成腺状小点。据此,该性状可以分解为4个性状,分别编码如下:毛的长短性,二元性状。短,0;长,1。毛的质地,二元性状。软,0;硬,1。毛的分枝程度,有序多态性状。单一毛,0;二歧分枝毛,1;星状毛,2。毛端是否具腺状点,二元性状。非腺毛,0;腺毛,1。4.2 综合评分法这种方法正好像竞技比赛的记分一样,容易为一般读者所理解。为了尽可能避免主观性,必须在编码之前先确定评分的

11、标准,规定合适的综合计算方法,并且要求评分者深明性状的分类学意义。具体方法随性状的要求而异,现举例说明。例1 猪品种的分类研究中,猪耳的形态学性状在育种学和生态学方面具有重要意义。采取综合评分法编码,将该性状纳入猪品种的定量分类研究中。根据猪耳的形态学特征及其生物学意义,先确定耳的大小和下垂程度是评分的两个主要依据,再规定评分标准:耳大小:耳小,0;一般,1;耳大,2;特大,3;特大遮眼,4。耳下垂:耳直立,0;耳平伸,1;耳下垂,2。从这两个方面评出分数,再将两分数相加得综合评分编码。譬如焦溪猪,耳特大遮眼、下垂,评分编码值6=4+2。例2 小麦抗锈性是小麦育种学重要特征,根据已有的记录将抗

12、锈性分为五个评分等级。发病特别严重、孢子堆大而普遍,0;有较大孢子堆、发病较普遍,1;有较小孢子堆、发病较轻,2;有抗性斑点,3;从未见发病,4。小麦的抗锈性又有抗条锈、抗杆锈和抗叶锈三种不同的区别。小麦的育种工作抗条锈品种容易获得,抗秆锈品种较少不易获得,抗叶锈品种很难得到。因此,对三种不同的抗锈性分别给予不同的权重系数,0.091(抗条锈)、0.435(抗秆锈)、0.474(抗叶锈)。譬如小麦“农大16”品种,对条、秆、叶的抗锈性等级评分分别是4、1、2。该小麦总的综合评分编码为(0.0914 + 0.435 + 0.4742)= 1.7474.3 演化分析法生物分类的某些无序多态性状,性

13、状自身呈现出树状的演化过程,可画出其演化关系树(tree)。树是图的一种,这里涉及图论的一些基本概念。考虑到演化的特点,有向树图中连接两顶点之间的弧是有方向的,于是图中存在一个顶点,可以它为起点连通到所有其他状态顶点,称为演化起源,而且这样顶点只有一个。除代表演化起源的顶点外,一个顶点,没有一条弧以它为起点,称为演化终点。 每一个演化终点代表一个演化方向,把这个演化方向定为新的性状。新性状的编码规定如下,演化起源的顶点编码为0。连接起源顶点到该性状的演化终点的通路称为主通路。 从起源顶点开始沿主通路,每经过一条边增加一个单位编码值,于是主通路上所有顶点的状态都赋给编码值,演化终点状态达到该性状

14、编码的最大值。非主通路上顶点状态的编码值这样规定:取出从起源顶点到该顶点的通路,该通路经过主通路的边数是其状态编码值。这样一来,所有的状态都赋给了新性状的编码值。对每一个演化终点照前述方法对所有状态赋给一个新性状编码值,编码工作完成。举一个例子。如果在某植物分类研究中,采用花序性状,出现的性状状态有复穗状花序、穗状花序、总状花序、圆锥花序和伞房花序,无疑这个性状属于无序多态。花序的演化实际过程比较复杂,这里假如按图3-1的方式展开,图中单生叶腋花序是假设状态,也是树图的演化起源。该树图有3个演化终点状态,分别是复穗状花序、伞房花序和圆锥花序。3个演化终点状态确定3个新的性状,分别记作性状I、I

15、I和III,新性状的编码列于图3-1的表中。性状状态新性状编码IIIIII总状花序011穗状花序100复穗状花序200圆锥花序012伞房花序021图3-1 部分花序的演化分析编码起源状态是单生叶腋花序,所有性状的编码均为0。 性状I的主通路 单生叶腋花序穗状花序复穗状花序;性状II的主通路 单生叶腋花序总状花序伞房花序;性状III的主通路 单生叶腋花序总状花序圆锥花序。按照前述编码规定,性状I中穗状花序和复穗状花序的编码分别为1和2;总状花序、圆锥花序和伞房花序,因为从起源状态到它们的路径不经过主通路,故编码值均为0。性状II中总状花序和伞房花序的编码分别为1和2;从起源状态到圆锥花序的通路有一条边通过主通路,故圆锥花序在性状II的编码值为1;从起源状态到穗状花序和复穗状花序的通路不经过主通路,故穗状花序和复穗状花序在性状II的编码为0。同理可作性状III的编码,不再赘述。其实,演化分析的编码方法也是性状分解法,它的分解是依据性状的演化关系。因此,演化分析方法能更好地反映生物演化谱系,对生物分类系统学的研究具有重要价值,在分支分类部分还要详细讨论。无序多态性状的编码方法介绍到此。经过编码以后的原始数据,如果有t个分类单

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 幼儿/小学教育 > 小学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号