家畜育种学第七章-个体遗传评定-BLUP法

资源描述

《家畜育种学第七章-个体遗传评定-BLUP法》由会员分享，可在线阅读，更多相关《家畜育种学第七章-个体遗传评定-BLUP法（33页珍藏版）》请在金锄头文库上搜索。

1、第七章个体遗传评定 BLUP法在前一章中，我们介绍了个体遗传评定的意义、基本概念和传统的育种值估计方法，这些方法在20世纪70年代以前被广泛应用于各种家畜的个体遗传评定。但自80年代以来，随着数理统计学（尤其是线性模型理论）、计算机科学、计算数学等学科领域的迅速发展,家畜育种值估计的方法发生了根本的变化，以美国动物育种学家C.R. Henderson为代表所发展起来的以线性混合模型为基础的现代育种值估计方法 - BLUP育种值估计法，将畜禽遗传育种的理论与实践带入了一个新的发展阶段。目前在世界各国，尤其是发达国家，这种方法已得到广泛应用，为畜禽重要经济性状的遗传改良做出了重大贡献。本章我们将

2、主要介绍BLUP育种值估计法的基本原理和使用方法，并简要介绍线性混合模型在估计遗传参数中的一些应用。由于这个方法要涉及线性模型及其他一些有关知识，为读者便于阅读理解起见，我们将先对它们作一简要介绍。第一节有关基础知识一、随机向量，期望向量和方差-协方差矩阵设x1，x2，xn是n个随机变量，令 mi = E(xi) = xi的数学期望， = Var(xi) = E(xi - mi)2 = xi的方差， = Cov(xi，xj) = E(xi - mi)(xj - mj) = xi和xj的协方差i = 1，2，L，n；将这n个随机变量和它们的期望、方差和协方差用向量和矩阵表示：，E(x) =，

3、Var(x) =称x为随机向量（random vector），m为x的期望向量(expectation vector)，可表示为E(x) = m，V为x的方差-协方差矩阵(variance-covariance matrix)，或简称协方差矩阵，可表示为Var(x) = V或V(x) = V，V中的对角线元素为各个x的方差，非对角线元素为各个x间的协方差，它是一个对称矩阵。注意在本书中，我们将所有的向量都用粗体小写字母表示，所有矩阵都用粗体大写字母表示。容易看出Var(x) = E= E(x - m)(x - m)若m = 0，则上式变为 Var(x) = E(xx) 若对x作线性变换y =T

4、x，则y的期望向量和协方差矩阵为 E(y) = E(Tx) = TE(x) = Tm Var(y) = Ey - E(y)y - E(y) = ETx - TmTx - Tm = ET(x - m)T(x - m) = TE(x - m)(x - m)T = TVar(x)T = TVT （7-1）若有随机变量 y = tx，则 Var(y) = tVt （7-2）若有p维随机向量x和q维随机向量u，它们之间的协方差可表示为Cov(x，u) = 二、个体间的加性遗传相关(Additive genetic relationship)个体x和y间的加性遗传相关是指在它们的基因组中具有同源相同(id

5、entic by decent)基因的比例，或者说从个体x的基因组中随机抽取的一个基因在个体y的基因组中也存在的概率。例如在不存在近交的情况下，一个亲本和它的一个后代之间的加性遗传相关为0.5，因为该亲本传递它的一半基因给后代，因而它们的基因组中有一半基因是相同的，同理祖代与孙代之间的加性遗传相关为1/4，半同胞之间为1/4，全同胞之间为1/2。一般地，任意两个个体x和y之间的加性遗传相关的计算通式为：（7-3）上式中：n1和n2：分别为由个体x和y到它们的共同祖先A的世代数；fA：为A的近交系数；：表示当x和y有多个共同祖先时要对所有连接x和y的通径求和；比较第二章介绍的个体间亲源相关系数

6、和个体近交系数的计算公式，可看出个体间的加性遗传相关就等于个体间亲源相关系数计算公式中的分子，而一个个体的近交系数等于其双亲的加性遗传相关的一半。一个个体与它本身的加性遗传相关为：axx = 1 + fx （7-4）上式中：fx：是个体X的近交系数。对于一个群体，如果我们将所有个体相互间的加性遗传相关用一个矩阵表示出来，设群体中的个体为1，2，n，则这个矩阵为A = 其中的aij为个体i和个体j之间的加性遗传相关，这个矩阵称为加性遗传相关矩阵（Additive genetic relationship matrix）或分子亲缘相关矩阵（numerator relationship matrix

7、），因为其中的元素是个体间亲源相关系数计算公式中的分子。需要说明的是，虽然用（7-.3）式和（7-4）式我们可以计算任意两个个体之间的加性遗传相关，但这一般要求画出完整的系谱图，这在系谱大而复杂时是很困难的。在实际中一般是用下面的2个递推公式来计算A中的每一元素：（7-5）（7-6）上式中： si和di：分别为个体i的父亲和母亲；sj和dj：分别个体j的父亲和母亲；：为si和di之间的加性遗传相关，当个体i的双亲或一个亲体未知时，为0；和：分别为个体i与sj和dj之间的加性遗传相关，当个体j的父亲未知时，为0，当个体j的母亲未知时，为0。个体间的加性遗传相关可用来计算个体间在某一性状上的育

8、种值的协方差。我们注意到在前面的定义中，个体间的加性遗传相关与它们之间的亲缘关系有关，而不涉及什么性状，也就是说，对于任何性状，两个体间的加性遗传相关都是一样的。但加性遗传相关也可理解为在某一性状上两个体的育种值之间的相关，于是有：上式中：AX和AY：分别为个体X和个体Y的育种值；和：为X和Y所在群体的加性遗传标准差，如果X和Y在同一群体，则=；于是对于一个有n个个体的群体，它们之间的育种值的协方差矩阵为Var(a) = A （7-7）上式中：a：为n个个体的育种值向量；A：为n个个体间的加性遗传相关矩阵。三、线性模型基础知识1、模型（Model）在统计学中，模型（或数学模型）是指描述观察值与

9、影响观察值变异性的各因子之间的关系的数学方程式。所有的统计分析都是基于一定的模型基础上的。一个模型应恰当地反应数据资料的性质和所要解决的问题。有各种不同水平的模型：真实模型：非常准确地模拟观察值的变异性，模型中不含有未知成份，对于生物学领域的数据资料来说，真实模型几乎是不可能知道的。理想模型：根据研究者所掌握的专业知识建立的尽可能接近真实模型的模型，这种模型常常由于受到数据资料的限制或过于复杂而不能用于实际分析。操作模型：用于实际统计分析的模型，它通常是理想模型的简化形式。影响观察值的因子也称为变量，它们可分为两类，一类是离散型的，它们通常表现为若干个有限的等级或水平，通过统计分析，我们

10、可估计这类因素的不同水平对观察值的效应的大小，或检验不同水平的效应间有无显著差异；另一类是连续型的，它呈现连续性变异，它们通常是作为影响观察值的协变量（回归变量）来看待的，通常需要估计的是观察值对这一变量的回归系数，有时一个连续性变量也可人为地划分成若干等级而使其变为离散型变量。离散型因子又可进一步分为固定因子和随机因子。区别一个因子是固定因子还是随机因子主要看样本的取得方法和研究的目的，如果对于一个因子我们有意识地抽取它的若干个特定的水平，而研究的目的也只是要对这些水平的效应进行估计或进行比较，则该因子就是固定因子，它的不同水平的效应就称为固定效应。反之，若一个因子的若干水平可看作是来自该因

11、子的所有水平所构成的总体的随机样本，研究的目的是要通过该样本去推断总体，则该因子就是随机因子，它的不同水平的效应就称为随机效应。2、线性模型（Linear model）在统计模型中线性模型占有很重要的地位。所谓线性模型是指在模型中所包含的各个因子是以相加的形式影响观察值，即它们与观察值的关系为线性关系，但对于连续性的协变量也允许出现平方或立方项。一个线性模型应由3个部分组成：1) 数学方程式,2) 方程式中随机变量的期望和方差及协方差,3) 假设及约束条件。【例7.1】设有肉牛190210日龄的体重资料，将日龄按每5天间隔分组，190210日龄就可分为4组，欲分析不同日龄组对体重的影响。可建

12、立如下的线性模型：yij = m + ai + eij上式中：yij ：是在第i个日龄组中的第j头肉牛的体重，为可观察的随机变量；m ：是总平均，是一常量；ai ：是第i个日龄组的效应，它是固定效应；eij：是剩余效应，也称为随机误差；式中随机变量的期望和方差及协方差为：E(eij) = 0，E(yij) = m + ai ，Var(yij) = Var(eij) = 2Cov(eij，eij) = Cov(eij，eij) = Cov(eij，ij) = 0此模型的假设和约束条件包括：1) 所有犊牛都来自同一品种,2) 母亲的年龄对犊牛体重无影响,3) 犊牛的性别相同或性别对体重无影响,4)

13、所有犊牛都在相同的环境下以相同的饲养方式饲养。等等。如果我们的资料为：日龄组犊牛体重1198204201220320621032052122164225220则对每一观察值都可根据上面的模型建立一个方程式：y11=198=m+ a1+ e11y12=204=m+ a1+ e12y13=201=m+ a1+ e13y21=203=m+ a2+ e21y22=206=m+ a2+ e22y23=210=m+ a2+ e23y31=205=m+ a3+ e31y32=212=m+ a3+ e32y33=216=m+ a3+ e33Y41=225=m+ a4+ e41Y42=220=m+ a4+ e42令则我们有y = Xa + eE(e) = 0，E(y) = XaVar(y) = Var(e) = I2此式称为线性模型的矩阵表达式，矩阵X称为关联矩阵，因为其中的元素指示了y中的元素与a中的元素的关联情况，I是单位矩阵。3、线性模型的分类线性模型可以从不同的角度进行分类，从其功能上分，可分为回归模型、方差分析模型、协方差分析模型、方差组分模型等；按模型中含有的因子个数，可有单因子模型、双因子模型、多因子模型；按模型中因子的性质（固定的还是随机的）可分为固定效应模型、随机效应模型和混合模型。这里将只介绍按因子的性质分类的情况。固定效应模型如一个

展开阅读全文