棉花的起源与驯化浅谈摘要:本文分三个部分简述了棉花的起源与驯化,第一部分主要阐明棉花的起 源,包括二倍体棉及四倍体棉的主要起源地;第二部分阐明了如今世界上主要栽培 的四倍体棉的演化过程;第三部分总结了分子水平上对棉花起源与驯化的一些主要 研究成果本文最后一部分是前景展望了,对棉花的起源与驯化的研究提出了一些 可行的方法关键词:棉花 起源 驯化 四倍体演化作物起源与驯化一直以来都是考古学家、进化生物学家以及作物科学家所关注 的热点领域作物野生祖先种的部分生理形态和遗传特性能够满足人们改良现有品 种的需要作物起源与驯化主要是研究作物起源于哪里,如何从野生种驯化为栽培 种一种栽培作物通常有一种或几种野生近缘种,鉴定栽培作物是从哪种近缘野生 种驯化而来,对有效利用野生种质具有重要的指导意义棉花是世界上主要的经济作物,在80 多个国家种植,不仅是世界上主要的天然 纤维来源,也是仅次于大豆的重要油料和蛋白作物棉属为被子植物锦葵目、锦葵科、棉族棉花原产于高温、干旱、短日照的热 带和亚热带的荒漠草原,是多年生的亚灌木或小乔木棉花的起源与驯化也可以被看作是一个人为干预的进化过程对棉花的起源及 四倍体棉的演化进行研究作物驯化的遗传学机理进行深入研究和探索,不仅有助于 了解栽培物种的形成乃至生命的起源和演化,而且对综合利用野生资源种的性状和 基因来改良现有的栽培品种和创造新的种质,乃至对人类现代农耕文明的发展都具 有重要的意义。
一、棉花的起源最新提出的棉属分类系统为 4 个亚属,共 51 种(亚种)包括 46 个二倍体种 (2n=2x= 26), 5个四倍体棉种(2n=4x=52)对二倍体而言,根据其亲级关系和地理 分布,可划分为A、B、C、D、E、F、G七个染色体组,分布在非洲、大洋洲和中 南美洲棉属中7个染色体组的染色体相对大小和脱氧核糖核酸(DNA)相对含量是不 同的各染色体组的染色体相对大小顺序是C>E>F>B>A>G>D;各染色体组的DNA 相对含量顺序是 C>G>A>E>F>B>D E 染色体组可能是棉属最原始的祖先所有的 二倍体棉种只有A和D染色体组被驯化栽培,包括草棉(G. herbaceum L.)和亚洲 棉(G. arboreum)其中,亚洲棉大约公元前2700年在旧大陆就已被驯化种植,亚 洲棉可生产用于纺织的纤维 D 染色体组的品种的种子上虽然也有短的绒毛,但是 它不能生产可纺织的纤维四倍体类群(2n=4x=52)有6个棉种,分布在中南美洲和其邻近岛屿,均是由二倍体 棉种的A染色体组和D染色体组合成的异源四倍体,即双二倍体AADD陆地棉 (G. hirsutum)和海岛棉(G. barbadense)是其中的两个栽培种,其余4个野生棉种 中有两个种,即茅叶棉Gianceolatum Tod.和达尔文氏棉Gdarwinii Watt([i]-[4]陆地棉原产于中美洲墨西哥一带。
根据考古学家研究,美洲印地安人种植棉花 的历史也非常悠久,在秘鲁北部的一个地方,人们曾经发掘出公元前2400多年前的 棉织鱼网,说明这里已经有了植棉业考古学家认为,真正的起源肯定可以追溯到 更为久远的年代19世纪末,中国开始引种美国陆地棉栽培种, 20世纪上半叶试种和部分推广斯 字、珂字、德字、岱字和金字棉等品种 50 年代开始,大规模进行棉种更换,并推 广自育品种和培育以陆地棉为母本、海岛棉为父本的陆地长绒棉 50年代前期更换 亚洲棉和退化陆地棉,后期用岱字15号复壮更新海岛棉原产于南美洲、中美洲和加勒比地区因曾大量分布于美国东南沿海及 其附近岛屿,故称海岛棉最早广泛栽培海岛棉是南美洲的智利到厄瓜多尔地区, 以后陆续传入北美洲、非洲的埃及、苏丹和亚洲的一些国家世界著名的埃及棉原属海岛棉种,在埃及经长时间选育驯化,品质优良、产量较 高,种植面积也最广现在长绒棉生产国家主要有:埃及、苏丹、苏联、美国、秘鲁 摩洛哥等近代世界各国培育的海岛棉品种很多,主要有埃及的“吉扎45”和“吉扎70”; 苏丹的“维爱斯”和“巴拉卡特”;苏联的“6465弗”和“9647依”;还有美国、秘鲁和摩洛 哥的“比马”等品种。
中国生产长绒棉已有较长历史,是与海岛棉相似的品种这个棉 种最初分布在云南开远、广东海南岛、福建南部等地区,大都为多年生海岛棉 20 世纪50年代,首先在新疆引种苏联一年生海岛棉获得成功,后又经多次棉种更换, 现在新疆地区大面积推广的“新海棉”和“军海 1号”等品种,纤维品质已符合纺织工业 的要求二、四倍体的演化四倍体棉种的起源途径曾是棉属系统发育中的中心问题之一多数科学家接受 了四倍体棉种是由染色体组 A 和染色体组 D 结合而成,因之美洲四倍体种为异源多 倍体的起源理论Skovsted和Webber对美洲棉种间杂交进行研究,在减数分裂中发 现了 13 个二价染色体和 13 个单价染色体,这个结果和异源四倍体理论相符合另 外,对染色体形态方面的研究也证实了美洲异源四倍体起源的理论经典的细胞遗 传学研究表明美洲四倍体种是异源多倍体,它包含来自非洲或亚洲的 A 染色体组和 与美洲二倍体种染色体组相似的 D 染色体组此后,科学家们采用不同的方法来验 证此理论, Gerstel 和 Phillips 采用观察杂交合成的多倍体在减数分裂时的染色体 配对情况的方法,Saha[5]等根据同工酶标记分析的方法,Brubaker^等根据遗传学作 图的分析方法,Cronn[7]等人根据DNA序列比较分析等方法对四倍体棉种的起源进行 了探讨研究,结果都证实了四倍体棉种是异源多倍体起源的理论。
Paterson等认为 四倍体棉花的演化由A、D基因组从一个共同祖先发生偏离,在一个共同核仁中再结 合,共同演化产生了新的核型,并超越了其二倍体祖先的基础Stelly[8]等认为从分 子细胞遗传学表明棉花陆地棉至少是八倍体起源Wendell认为棉花的“二倍体”祖 先本身就是基因组结构已显著二倍化了的古四倍体,因此由四倍体杂交再经多倍化 形成的棉花应是八倍体,而不是四倍体,从这点看,棉花的多倍性水平被低估了四倍体棉种的A、D两种染色体,一组来自非洲,一组来自南美洲这两组相隔 遥远的棉种如何相遇并进行结合的问题,有不同的假说一种假说是 A 染色体组棉 种的种子,从起源地非洲漂流过大西洋到达南美洲另一种假说是,在白垩纪后期 或第三纪初期,南美洲的东岸和非洲的西岸是连接在一起的,A组和D组棉种是可以 靠近的,两者发生杂交,然后自然加倍,形成了异源四倍体类型,后来发生了大陆 漂移运动,非洲与南美洲之间被大西洋隔开,四倍体类型在中美洲及南美洲走上了 自己分化发展的途径另外一种意见认为,可能由于人类活动携带亚洲棉 A 染色体 组的种子,经过太平洋到达新世界,在栽培过程中与 D 染色体组的一个或几个种相 互杂交而形成四倍体。
Gerstel 和 Phillips 根据非洲南部现存的草棉野生类型是亚 洲棉花唯一真正的野生类型,提出了非洲草棉通过太平洋传播的途径Sherwin认为 新世界棉不存在野生的类型,栽培的草棉是人类带到南美洲北部来的Johnson也认 为由人类把草棉带至新世界的热带地区,在那里成为栽培种,并且不止和一个 D 染 色体组种杂交形成了天然杂种Fryxell对整个生态情景进行分析后,认为与人类活 动无关,异源四倍体极大可能是在更新世时期,祖先 A 染色体组种通过大西洋传播 到新世界后才发生的 Cronn 等人近年的研究结论也为异源四倍体更新世起源的理 论提供了更充分的证据[10]三、分子水平上的研究成果1 分子标记研究Wendell分析了 A、D、AD染色体组叶绿体DNA限制位点的差异,四倍体棉种 细胞质供体种是来源于 A 染色体组二倍体与一个类同于中棉和非洲棉 cpDNA 的棉 种宋国立[12]对包括4个栽培种的32个种和7个陆地棉野生种系RAPD分析,得出 四倍体棉种是由与草棉类似的棉种作母本供体种,与戴维逊氏棉类似的棉种作父本 合成的异源四倍体种Abdallas等利用AFLP的方法证实,异源四倍体棉种的A染 色体组与二倍体棉种的A染色体组的亲源程度比其D染色体组与二倍体棉种D染色 体组的亲源程度更近。
郭旺珍[14]等利用SSR分子标记技术,对棉属A、D染色体组 二倍体及四倍体代表棉种进行了遗传多样性分析,所得到的结果支持拟似棉是 D 染 色体组最原始棉种,棉属不同染色体组是共同起源、单元进化的理论M.Mei[15 ]等 (2004)用AFLP、RFLP及SSR标记构建遗传图谱并对棉纤维性状进行QTL分析,检测 到7个与纤维性状相关的QTL位点,这些位点都位于A、D染色体组部分同源区段, 并认为在棉花的驯化过程中这些染色体区段被驯化并选择2 原位杂交研究Stelly 等进行的棉花荧光原位杂交结果表明陆地棉至少是八倍体起源 Hanson 等用BAC-FlSH方法,根据FlSH信号在A、D基因组的强度不同,以及非Ct-1DNA 作封阻时仅在雷蒙地棉上观察到重复信号,最后他得出D-基因组起源于BAC1928 王春英等 对海岛棉进行了基因组原位杂交,显示海岛棉A与D两亚染色体组的少数 成员之间发生过交换,或两亚组部分染色体的局部 DNA 序列是同源的王坤波等对 海岛棉品种“海 7124”的体细胞染色体进行荧光原位杂交,实验结果直观地证实了 前人有关四倍体棉种是双二倍体起源的推论随着原位杂交技术的发展,fiber-Fish 等技术也逐步应用于棉花的起源与驯化的研究。
四、前景展望随着分子生物学的不断发展,带动了起源与驯化研究最大的科技跨越为很多 相关起源与驯化的问题提供的了解机会,包括作物祖先的确认、作物驯化的地点和 时间、以及驯化的种群结构随着分子标记的成本降低,使研究主要作物的表型性 状的遗传基础具备了必要资源 QTL 分析及基因组计划的进展还使确定各种作物进 化过程中所选择的基因组区域或基因成为可能某些情况下,研究者还可以精确定 位作物产量的主要相关性状的确切核苷酸的变化其中一种方法就是QTL分析,QTL分析是定位驯化或者改良相关基因的主要方法 虽然这种分析方法可以提供大量的关于感兴趣基因的遗传结构的信息,但是这种方 法是劳动密集型和相当耗时的一种方法,而且这种方法要求有大的分离群体的发育 和表型特征,还需要有完善的遗传图谱此外,QTL作图职能提供相对低水平的分辨 率,基因被定位于几个 cM 的跨度内,研究的物种不同,这几个 cM 可能包含的基因 不同,有的物种可能包含几百个基因在内在作物中只有极少数的 QTL 被克隆,以 作图为基础的克隆在那些无性繁殖或者生长期很长的物种中是没有多大用途的该 方法虽然有不少缺点,但是现在时在棉花的起源与驯化研究领域应用最多一种方法。
另一种 QTL 作图的方法是关联作图,关联作图是以连锁不平衡为基础的基因作图方 法,关联作图不仅不需要通过杂交创建作图群体,而且能提供更高的精确度关联 分析又分为全基因组途径的关联分析和候选基因途径的关联分析候选基因关联分 析最早应用于人类遗传学的研究 ,在植物方面的应用只是最近才开始 2001 年, Thornsberry等首次成功地将关联分析引入植物,利用关联分析评价Dwarf8基因与 开花期变异的关联多态性Palaisa et al., 2004年利用关联分析验证Y1基因的功 能,在玉米的黄色胚乳组织中,编码八氢番茄红素合成酶 Olsen et al., 2006, 研究 Wax 基因的选择性清除对连锁不平衡的影响(显著降低)[16]第三种确定驯化相关基因的策略是在作物物种及其祖先野生种之间进行大范围 (区段)的基因组扫描,从而确定驯化过程中的证据基因型还是序列为基础的基 因组扫描方法,该方法还没有在棉花的起源与驯化中应用棉花的起源与驯化,还将是棉花研究领域的。