从遗传学探讨中华民族的源与流

上传人:精****档 文档编号:46981743 上传时间:2018-06-28 格式:PDF 页数:8 大小:287.49KB
返回 下载 相关 举报
从遗传学探讨中华民族的源与流_第1页
第1页 / 共8页
从遗传学探讨中华民族的源与流_第2页
第2页 / 共8页
从遗传学探讨中华民族的源与流_第3页
第3页 / 共8页
从遗传学探讨中华民族的源与流_第4页
第4页 / 共8页
从遗传学探讨中华民族的源与流_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《从遗传学探讨中华民族的源与流》由会员分享,可在线阅读,更多相关《从遗传学探讨中华民族的源与流(8页珍藏版)》请在金锄头文库上搜索。

1、从遗传学 探讨中华民族的源与流杜若甫 肖春杰本文根据 38个基因座的基因频率, 对我国各地的汉族人群与少数民族之间的血缘关系及各族的人种归属进行了分析。 作者认为, 全国各地的汉族与少数民族可分为南北两大群, 南方各地汉族及各族间的遗传距离都比北方要大; 长江以北的汉族与少数民族属北方蒙古人种, 长江以南的汉族与少数民族属南方蒙古人种。且南、北汉族均与当地少数民族的血缘相近, 而南、北汉族间的血缘却很远。这说明, 长期以来, 汉族与少数民族之间有很多血缘交流。作者杜若甫, 1930年生, 中国科学院遗传研究所研究员; 肖春杰, 1960 年生, 云南大学生物系教授。一、从遗传学角度研究民族的源

2、与流的特殊意义关于中华民族的源与流, 已有的大量论述绝大部分是从历史学、考古学、文化人类学、语言学等角度进行探讨的。本文将从遗传学角度对这一问题进行探讨, 以便与其他学科所进行的探讨相互印证与补充。从遗传学角度对民族的源与流进行研究,所用的指标是基因。基因是人体细胞内的 DNA 序列片段, 它稳定地代代相传, 并以一定的频率发生变化。 研究基因主要是通过对基因的产物 ( 蛋白质、酶) 进行分析, 得出某一人群在某一个基因座上各种类型( 即等位基因) 的频率。从遗传学角度研究民族的源与流, 其优点在于基因具有代代相传的稳定性,据此得出的结论也有较强的可靠性。相比之下, 历史文献的记载有时不全或者

3、失真,对史前时期人类活动的追述又有极大的局限性; 考古学的发现虽越来越多,但资料仍零星不全,不连续、不完整, 甚至有时对年代的测定也不准确;语言作为研究民族的源与流的指标, 其最大缺点是其不稳定性, 极易因被其他民族征服、与其他民族交往或杂139居而急剧地发生变化。但是, 从遗传学角度研究民族的源与流也存在两方面的问题, 一是有些基因受自然选择的影响, 二是随机遗传漂变可以使某一人群中的基因频率发生一些随机的变化。这两者都会给追踪该人群的源与流造成一定困难。而利用多个基因座的等位基因频率来研究民族间的血缘关系和民族的源与流, 就可以在很大程度上克服这两方面可能造成的困难。我们根据中国各地汉族人

4、群和少数民族 ( 共 38 个) 基因座上的基因频率数据,计算了这些人群和民族两两之间的 Fst 遗传距离;然后根据遗传距离进行了聚类分析, 绘出了聚类图, 用的是相邻单位连接法 ( Neighbor- joining method)。此外, 还利用这些基因频率数据进行主成分分析,然后以第一二主成分为坐标,绘制了主坐标图。这些基因频率数据来自国内外的有关文献和我们尚未公开发表的调查数据。经过计算与分析, 一共有 1 923 套基因频率数据可用( 一个人群一个基因座上的基140中国社会科学 1997 年第 4 期需要简要说明的是: 1. 在进行不同民族与人群的基因频率调查时, 我们实验室和大多数

5、研究单位都要求所取样本三代以内没有与外族通婚, 在当地已居住三代以上, 而且一般均不在该民族居住的边缘地区取样。 2. 计算遗传距离有好几种公式, 它们大同小异, 其目的都是把各个人群两两之间在各个位点上的基因频率的全部差异归纳起来, 最后用一个数值来表示。 3. 聚类分析的几种方法也大同小异。它主要是根据各个人群两两之间的遗传距离的大量数 值, 把各个人群归纳在一个系统树上, 以表示他们之间的相似程度。4. 主成分分析是一种极为复杂的数理统计方法, 只有大型计算机才可以进行。它可以将造 成各个人群在各个位点上的基因频率的全部变量的主要因子 (即主成分) 分析出来。 在人类群体遗传学的基因频率

6、分析中, 第一主成分所包含的变量 (即信息量) 一般可达 30% 以上, 第二主成分所包含的变量可达 20% 左右, 第三、四、五、六主成分所含变量越来越少, 因此其意义也就越来越小了。 而各主成分代表人类、 民族发展历史上什么具体事件, 则还需要 结合考古学、历史学等学科的成果来分析。Cavalli- Sforza L. L. et al. , 1994. H istory and Geograp hy of H uman Genes, Princeton Uni- versity Press, pp. 3940.Saitou N. and M . Nei, 1987. The neighb

7、or- j oining method: A new method for reconstructing p hylogenetic trees. Mol. Biol. Evol. , 4 (4) : pp. 406426.Cavalli-Sforza L.L.and W.F.Bodner, 1971.T he Genetics of H uman Populations,San Francisco, W. H. Freeman; Cavalli- Sforza L. L . et al. , 1994. H istory and Geograp hyof H uman Genes,Princ

8、eton University Press,pp. 2630.用于进行分析的基因座 ( 即遗传标记) 是: ABO、MNSs、 Rh、P、 Diego、 Duffy、 Kell、 Kidd、Lewis、Lutheran等红细胞血型, 白细胞抗原系统中的HLAA、B、C、D, 酸性磷酸酶、腺 苷脱氨酶、腺苷酸激酶、酯酶 D、葡萄糖- 6- 磷酸脱氢酶、谷丙转氨酶、乙二醛酶、葡萄 糖磷酸变位酶- 1、磷酸葡萄糖酸脱氢酶等红细胞酶,A- 抗胰蛋白酶、补体第二、三、四、六、七组分, 备解素因子 B、血清 A - 球蛋白、结合珠蛋白、免疫球蛋白 Gm 因子与 Km 因 子、转铁蛋白等血清蛋白质, 以及血

9、型分泌型、和盯聍类型、苯硫脲味觉等。其中MNSs与Rh 都以一个基因座来对待, 而以各单倍型频率作为基因频率。因频率算一套数据) 。 当同一少数民族或同一省 、 市、 自治区的汉族人群在一个基因座上有不止一套的基因频率数据时, 便用加权法得出其加权平均值, 用平均值计算遗传距离,从而提高了基因频率的准确性。本研究的全部计算、制图, 都是在美国斯坦福大学医学院 L. L. Cavalli- Sforza教授实验室中用 Philip 软件进行的。二、汉族各地人群30 个汉族人群间相互间的遗传距离共有 435 个数值 ( 见表 1) 。 从表 1所列数值可以看出, 遗传距离最小的是03, 如黑龙江与

10、吉林、山西、山东, 辽宁与吉林、山东,山东与河南、吉林, 湖北与云南, 宁夏与安徽、甘肃、山东、天津, 新疆与北京、天津、江苏、陕西、安徽、吉林、宁夏, 吉林与天津, 这些省、市、自治区的汉族彼此间遗传距离都很小。而广西与吉林、山东, 青海与广东、广西,江苏与湖北, 贵州与山西等遗传距离则很大, 都在1 000左右或以上。图 1. 汉族 30 个人群的聚类图由于表 1 所列遗传距离数据很多, 不容易看出30 个人群相互关系的主要特点, 而从根据这435 个遗传距离值进一步进行聚类分析所绘出的聚类图( 见图1) 和主成分分析后绘出的主坐标图 ( 见图 2) , 则可以比较明确地看出一些特点。从图

11、1 可以看到, 全国汉族分南、 北两大支, 图中台湾以上, 都是长江以南的省、自治区, 它们是浙江、海南、云南、福建、广东、江苏、湖北、四川、湖南、贵州、广西, 而新疆以下除上海、江苏、安徽以外都是北方的省、 市、 自治区: 天津、陕西、河北、吉林、山西、黑龙江、青海、山东、河南、辽宁、内蒙、甘肃、北京、 宁夏。 江苏与安徽分别包括了对苏北与淮北的调查结果,因此虽然与北方其他人群相距较远, 但仍与北方人群聚到一起了。 上海汉族来自四面八方, 比较杂, 这可能是上海汉族与北方人群聚到一起的原因。从图 1 还可看出, 南方人群间分得比较开, 即每一枝杈均较长, 枝杈长表示彼此间遗传差异大。 而在北

12、方人群中, 一141从遗传学探讨中华民族的源与流 些真正完全是北方人的人群都紧密地聚到了一起,只有安徽、江苏、上海、新疆汉族人群才离得较远。南方人群间遗传差异比北方人群间的大,这是历史、地理原因造成的: 1. 当北方战乱与人口迁移频繁时, 南方战争少, 迁移也少。汉朝以后北方人口开始大批南迁,才迫使原来长江流域居民南迁,以后又西迁至贵州、云南,有一部人( 苗、瑶等) 一直迁至境外缅甸、越南等地。2. 南方山多, 交通不便, 而北方有华北平原、关中平原、松辽平原等, 交通方便,地理隔离少,因而北方各地相互间基因流动多, 而南方各人群间隔离较多。汉族 32 个人群 ( 包括香港与澳门的人群) 的主

13、坐标图 ( 见图 2) 与系统树十分一致, 北方人群在上方,南方人群在下方。北方人群中,包括了安徽、江苏、台湾、上海等,安徽、江苏、上海等汉族人群与北方人群相近的原因在上面已有解释。台湾人群实际上也来自四面八方,早期移民主要是从福建、广东等迁去的, 而后来, 由于蒋介石被逐而到台湾, 有不少北方人去了台湾。在整个坐标图上, 广西、湖南、广东、 江西、福建、贵州等人群在最下方, 而青海、山西、吉林、山东、内蒙、甘肃等人群在最上方, 说明这两组人群彼此间的遗传结构差异最大。图 2. 汉族 32 个人群的主坐标图总之,对汉族人群的遗传距离聚类分析以及主成分分析都明确显示,汉族分南、 北两大群。 南方

14、汉族各地人群之间差异较大, 北方汉族各地人群之间差异较小。三、少数民族37 个少数民族相互间的遗传距离见表 2。 表中数字表明, 布依族与鄂伦春族( 1 611) 、 京族与鄂伦春族 ( 1 598) 、 布依族与哈萨克族( 1 555) 、 畲族与哈萨克族( 1 553) 、 达斡尔族与哈萨克族 ( 1 494) 、佤族与鄂伦春族 ( 1 482) 、 布依族与锡伯族 ( 1 452) 、 黎族与柯尔克孜族 ( 1 413) 、布依族与东乡族 ( 1 381) 、壮族与柯尔克孜族 ( 1 365) 等遗传距离较大, 它们一般都是一个南方民族与一个北方民族, 只有达斡尔族与哈萨克族都是北方民族

15、,不过一个在东, 一个在西。遗传距离较近的是德昂族与傈僳族 ( 3) 、赫哲族与锡伯族 ( 10) 、赫哲族与达斡尔族 ( 25) 、赫哲族与东乡族 ( 26) 、东乡族与回族 ( 30) 、东乡族与达斡尔142中国社会科学 1997 年第 4 期族 ( 41) 、达斡尔族与锡伯族 ( 37) 、达斡尔族与鄂伦春族 ( 37) 等, 它们一般是两个北方民族或两个南方民族。可是也出现一些乍一看不太容易理解的数值, 例如佤族与塔吉克族的遗传距离只有 54, 这可能有一定的偶然性, 因为这两个民族目前都有基因频率的基因座数较少。而聚类分析和主成分分析,一般可以得出更符合实际的结论。在用邻接法绘出的聚

16、类图上, 全国 37 个少数民族明确地分为两支, 右边一支是17个北方民族,左边一支是 20 个南方少数民族 ( 见图 3) 。图 3. 37 个少数民族的聚类图在南方民族中, 佤族不再与塔吉克很接近了,而是与傈僳、德昂、高山、傣等南方民族聚在一起了。四个新疆民族 ( 维吾尔、哈萨克、塔吉克、柯尔克孜) 单独成为一支, 彼此间遗传距离不大 ( 在图中以平行线的长度表示) , 最后与其他民族相聚。其中研究得较多因而基因频率数据较多的维吾尔族与哈萨克族, 已可基本肯定应属蒙古人种,据初步分析, 他们的蒙古人种血缘成分约占 70%左右。有点令人奇怪的是 300 多年前从东北迁到新疆的锡伯族, 居然也和早在新疆的柯尔克孜、塔吉克、维吾尔、哈萨克等族聚在一起了。图 3 中东北的一些民族除鄂伦春外, 彼此十分靠近。 藏族属北方民族, 但历史上却融入了少量中亚细亚人、波斯人、 阿拉伯人的血缘。羌族也属北方民族。全国回族实际上并无统一起源, 本文所用数据虽然也有一部分是海南岛回族的数据,但主要是宁夏等地北方回族的数据, 所以回族仍归北方民族。在 20个

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号