《基因与基因组学》由会员分享,可在线阅读,更多相关《基因与基因组学(166页珍藏版)》请在金锄头文库上搜索。
1、 第二章第二章 基因、基因组与基因组基因、基因组与基因组学学 Gene, Genome and Genomics 武汉大学医学病毒学研究武汉大学医学病毒学研究所所 分子病毒分子病毒室室人类对生命现象的认识人类对生命现象的认识 整体论整体论 揭示生命的奥秘揭示生命的奥秘21世纪世纪GenomicsStructuralGenomicsFunctionalgenomics第一节第一节基因基因gene一、基因的概念与内涵一、基因的概念与内涵Theconceptofgenecontent生物学的进展使基因的概念不断在延伸和生物学的进展使基因的概念不断在延伸和扩展扩展Advancesinbiologyto
2、theconceptofgenecontinuouslyextendedandexpanded1909年WilhelmJohannsen将将“遗传因子遗传因子”“Geneticfactors”简化为简化为“基因基因”(gene)希腊希腊语语“给予生命给予生命”之意之意。一个基因一种酶一个基因一种酶(1941年年G.W.BeadleE.L.Tatum)证明证明基因通过它所控制的酶决定着代谢中生化反应步骤,进基因通过它所控制的酶决定着代谢中生化反应步骤,进而决定生物性状而决定生物性状.onegene,oneenzyme一个基因一条多肽链一个基因一条多肽链(1949年年L.C.Pauling与合作者
3、与合作者在研究镰刀型细胞贫血症时推论基因决定着多肽链的氨在研究镰刀型细胞贫血症时推论基因决定着多肽链的氨基酸顺序基酸顺序.ageneapolypeptidechain1957年法国遗传学家Benzer提出了顺反子学说。认为基基因因为为DNA分分子子上上一一段段核核苷苷酸酸顺顺序序,一个基因内部仍可划分若干个起作用的小单位,即可区分成顺反子、突变子和重组子。 1961年法国F. Jacob和J.L. Monod的研究成果,又大大扩大了人们关于基因功能的视野。根据基因功能把基因分为结构基因和调节基因基因分为结构基因和调节基因。 染色体分子中除了编码蛋白质的结构基因外染色体分子中除了编码蛋白质的结构
4、基因外还有编码最终产物是还有编码最终产物是RNA的基因的基因。病毒病毒RNA作为遗传信息的携带者作为遗传信息的携带者RNAasarecepterofheredityinformation基因是生物遗传的基本单位。是具有遗基因是生物遗传的基本单位。是具有遗传效应的传效应的DNA分子片段。分子片段。Ageneisthebasicunitofheredityinalivingorganism基因基因:是是指合成有功能的蛋白质、多肽链指合成有功能的蛋白质、多肽链或或RNA所必需的全部核苷酸序列所必需的全部核苷酸序列。Geneisthewholenucleotideacidsequencethatise
5、ssentialtosynthesizefunctionalproteinandpolypeptideorRNA. 基因的概念基因的概念 The concept of geneThe concept of geneFromsimplevirustocomplicatedhigherorganisms,thetotalgeneticinformationthatcontrollifeactivityisstoredingenes.不同的生物,基因的结构、数目及组合不同的生物,基因的结构、数目及组合方式不同。方式不同。Therearedifferentstructure,numberandcomb
6、inationformsofgenebetweendifferentspecies.同一生物,除精细胞和卵细胞外,同一生物,除精细胞和卵细胞外,所有所有细胞都具有相同的遗传信息细胞都具有相同的遗传信息Foronespecies,allcellsexceptforgermcellspossessthesamegeneticmaterials.基因包括:基因包括:编码序列编码序列(编码蛋白或(编码蛋白或RNA产产物的区域物的区域-外显子外显子(exon)、调控序列调控序列(侧翼序列)、(侧翼序列)、插入序列插入序列-内含子内含子(intron)Genesinclude:codingsequence
7、(encodingproteinsorRNAproductoftheregion-exon(exon),regulatorysequence(flankingsequence),insertionsequence-intron(intron)调控序列调控序列(侧翼序列)(侧翼序列)主要有:主要有:启动子、启动子、增强子、增强子、终止子等终止子等geneshaveregulatoryregionsinadditiontoregionsthatexplicitlycodeforaproteinorRNAproduct.启动子(启动子(promoter):):DNA链上链上RNA聚聚合酶识别,结合,
8、启动转录的部位。合酶识别,结合,启动转录的部位。PromotersareDNAnucleotidesequencesrecognizedbytheRNApolymerasesastheirattachmentsites原核生物启动子原核生物启动子:TTGACA-识别位点识别位点;TATAAT-结合位点结合位点(TATA盒或盒或Prinbow盒)盒);启始位点启始位点:与:与RNA第一个核苷酸互补的第一个核苷酸互补的碱基对碱基对真真核核生生物物II类类基基因因启启动动子子:AT丰丰富富区区,(TATA序序列列)Hogness盒盒即即为为RNA聚聚合合酶酶II与与启启动动子子的的结结合合部部位位;
9、其其上上游游有有CAAT盒;盒;CAAT盒的两侧有盒的两侧有GC盒。盒。 TATATATA盒盒盒盒 CAATCAAT盒盒盒盒 GCGC盒盒盒盒 增强子增强子增强子增强子 顺式作用元件顺式作用元件顺式作用元件顺式作用元件 结构基因结构基因结构基因结构基因- -GCGC-CAAT-TATAGCGC-CAAT-TATA转录起始转录起始转录起始转录起始真核生物启动子保守序列真核生物启动子保守序列真核生物启动子保守序列真核生物启动子保守序列增强子(增强子(enhancers):启动子上游或下:启动子上游或下游有一类核苷酸顺序,可增强邻近基因的游有一类核苷酸顺序,可增强邻近基因的转录速度,称为增强子或活化
10、子。转录速度,称为增强子或活化子。终止子(终止子(terminator):为为DNA模板上终止模板上终止转录的信号。有两类转录的信号。有两类:依赖依赖因子的终止子因子的终止子不依赖不依赖因子的终止子因子的终止子区别:区别:不依赖不依赖因子的终止子富含因子的终止子富含GC;茎;茎-环结构环结构后有后有PolyU区;依赖区;依赖因子的终止子缺少因子的终止子缺少GC,也,也无无PolyU尾。尾。终止子与终止子与RNA发卡结构发卡结构二二、DNA损伤(损伤(damage)和修复)和修复(repair)DNA损伤是指损伤是指DNA正常的化学或物理正常的化学或物理结构的改变结构的改变。Alesionisa
11、nalterationtothenormalchemicalorphysicalstructureoftheDNA.1.DNA的自发损伤(的自发损伤(DNAlesionsofspontaneous)有些损伤是自发性的,是由于有些损伤是自发性的,是由于DNA内在化内在化学活性以及细胞中存在的正常活性分子所学活性以及细胞中存在的正常活性分子所致。致。IsduetotheinherentchemicalactivityofDNAandcellsinacausedbythenormalactivitymolecule.1)脱氨基(脱氨基(deamination)2)脱嘌呤()脱嘌呤(depurinat
12、ion)3)氧化性损伤)氧化性损伤(oxidativedamage)4)复制滑移)复制滑移(replicationslippage)5)互变异构移位()互变异构移位(tautomericshift)类型类型 碱基和脱氧核糖间的糖苷键受到破坏碱基和脱氧核糖间的糖苷键受到破坏羟自由基等活性氧(羟自由基等活性氧(ROS)的存在)的存在(O2-,OH-,H2O2)会在正常条件下对会在正常条件下对DNA发生氧化损伤。发生氧化损伤。重复序列可诱发复制滑移重复序列可诱发复制滑移互变异构体:酮式和烯醇式互变异构体:酮式和烯醇式胸腺嘧啶胸腺嘧啶酮式结构易与酮式结构易与A配对配对,烯醇式结构易与烯醇式结构易与G配
13、对。配对。腺嘌呤的酮式结构,与腺嘌呤的酮式结构,与T配对配对,烯醇式结构可与烯醇式结构可与C配对。配对。DNA的诱发损伤(的诱发损伤(lesionsofmutagenesis)由诱变剂(由诱变剂(mutagen)导致的)导致的DNA损损伤。伤。Bythemutagenicagent(mutagen)inducedDNAdamage物理诱变因素物理诱变因素-非电离辐射与电离辐射非电离辐射与电离辐射Physicalmutagen-Non-ionizingradiationandionisationradiation化学诱变剂化学诱变剂Chemicalmutagen碱基类似物(碱基类似物(basea
14、nalog)、)、烷化剂(烷化剂(alkylatingagent)、)、嵌入剂(嵌入剂(intercalatingagent)、)、脱氨剂(脱氨剂(deaminatingagent)交联是由二聚体引起的,二聚体可以在交联是由二聚体引起的,二聚体可以在同一条链相邻的碱基之间产生,也可以同一条链相邻的碱基之间产生,也可以是在二条链的碱基之间形成。是在二条链的碱基之间形成。 引起引起DNADNA复制错误复制错误 嘧啶比嘌呤对紫外线敏感得多嘧啶比嘌呤对紫外线敏感得多 胸腺嘧啶二聚体胸腺嘧啶二聚体 DNA链链的的断断裂裂,或或使使DNA分分子子内内或或分分子子之之间间发发生生交交联联反应反应非电离辐射:
15、非电离辐射:紫外辐射(紫外辐射(UV radiation)嘧啶的紫外线光化产物嘧啶的紫外线光化产物嘧啶的紫外线光化产物(嘧啶二聚体嘧啶的紫外线光化产物(嘧啶二聚体)相邻嘧啶的4位和6位碳原子发生共价交联 电离辐射(电离辐射(ionizingradiation)X线和r射线等,直接作用-引起DNA的断裂,对DNA的损伤;间接作用-在细胞内激发形成如过氧化物类的反应分子吖啶橙、吖啶黄素、原黄素等碱基对的类似物,易造吖啶橙、吖啶黄素、原黄素等碱基对的类似物,易造成移码突变。成移码突变。化学诱变剂化学诱变剂 碱基的类似物碱基的类似物脱氨剂-亚硝酸等能使嘌呤或嘧啶脱氨,改变核酸结构和性质,造成DNA复制
16、紊乱。烷化剂一般引入的烷基连接在氮、氧、碳等原子上。常具突变源性(mutagenic)甲磺酸乙酯(EMS)、亚硝基胍(NG)、芥子气等。通过改变碱基结构使碱基错配。诱变剂以三种不同的方式导致突变:诱变剂以三种不同的方式导致突变:一、作为碱基类似物,当复制叉上新生DNA合成时被错误的当作底物。二、直接与DNA反应,造成结构改变,导致DNA复制时模板链的错误复制。三、,使细胞合成如过氧化物等可直接导致突变的化学物质。间接作用于DNA。损伤的检测-单细胞凝胶电泳(Singlecellgelelectrophoresis,SCGE)由Ostling等1984首创,后经Singh等(1988)进一步完善
17、并逐渐发展起来的一种快速检测单细胞DNA损伤的实验方法,适用于多种细胞,能够灵敏地检测DNA断裂。在检测诱变剂、射线等对DNA的损伤、监测环境污染物对机体的遗传损害、研究毒物致癌机制等方面有广泛的应用价值。因其细胞电泳形态颇似彗星,又称彗星实验(cometassay)。彗星实验彗星实验(cometassay)两层凝胶、单细胞悬液 、细胞裂解 、DNA解旋、电泳、中和与染色 、镜下观察分析DNA损伤损伤修复(repairofDNAdamage)在多种酶的作用下在多种酶的作用下,生物细胞内的生物细胞内的DNA分子分子受到损伤以后恢复结构的现象受到损伤以后恢复结构的现象.1949年A.凯尔纳偶然发现
18、光复活 (直接修复) 灰色链丝菌 光光修修复复photoreactivation(直接修复)(直接修复) 在在可可见见光光存存在在的的条条件件下下,光光复复活活酶酶作作用用将将UV引引起起嘧嘧啶啶二二聚聚体体分分解解为单体。为单体。1958年年R.L.希尔希尔证明即使不经可见光的照证明即使不经可见光的照射,大肠杆菌也能修复它的由紫外线所造射,大肠杆菌也能修复它的由紫外线所造成的成的DNA损伤,而后又证明其他损伤,而后又证明其他微生物微生物也也有这种功能有这种功能,当时就把这种修复功能称为暗当时就把这种修复功能称为暗复活或复活或暗修复暗修复(切除修复(切除修复excisionrepair)核酸内
19、切酶切开二聚核酸内切酶切开二聚体的体的5 5末端末端, ,形成形成3 3-OH-OH和和5 5-P-P的单链的单链缺口缺口 核酸外切酶从核酸外切酶从5 5-P-P到到3 3-OH-OH方向切除二方向切除二聚体,并扩大缺口聚体,并扩大缺口 DNADNA聚合酶以另一条聚合酶以另一条互补链为模板,从原互补链为模板,从原有链上暴露的有链上暴露的3 3-OH -OH 端起合成缺失片段端起合成缺失片段 连接酶将新合成链的连接酶将新合成链的3 3-OH-OH与原链的与原链的5 5-P-P相连接相连接 暗暗 修修 复复暗修复体系有四种酶参与反应。暗修复体系有四种酶参与反应。The dark repair sy
20、stem has four kind of enzyme participation response. 暗修复普遍地存在于原核生物、低等真核生物、高等真核生物的两栖类乃至哺乳动物 The dark repair exists generally in the Prokaryotes, the low status eukaryon , the higher eukaryon , amphibians and even mammal 。错配修复系统(错配修复系统(Mismatchrepair)错配矫正酶错配矫正酶DNA聚合酶聚合酶DNA连接酶连接酶等等11种蛋白参与种蛋白参与酶错配矫正酶中的酶
21、错配矫正酶中的MutSMutS部分识别部分识别错配区域,而错配区域,而MutHMutH和和MutLMutL识别没识别没有甲基化的有甲基化的GATCGATC序列。之后,将序列。之后,将新合成的单链上切出一个缺口。新合成的单链上切出一个缺口。切除:由核酸外切酶将距离切除:由核酸外切酶将距离GATCGATC到到错配区域间的错配区域间的DNADNA链切除。为了防止链切除。为了防止剩下的暴露的单链遭到降解,需要剩下的暴露的单链遭到降解,需要有单链结合蛋白(有单链结合蛋白(SsbSsb)将其保护起)将其保护起来。修复:由来。修复:由DNADNA聚合酶聚合酶全酶进行全酶进行合成,连接酶对缺口进行连接。合成,
22、连接酶对缺口进行连接。 E.Coli错配修复系统错配修复系统Mismatchrepair研究描述了一种由错配研究描述了一种由错配引起的引起的DNA切除的启切除的启始和终止模式。始和终止模式。2005年122卷 5期“Reconstitutionof5-DirectedHumanMismatchRepairinaPurifiedSystem”YanbinYanbinZhang, FenghuaZhang, FenghuaYuan, StevenYuan, Steven R.R.Presnell, KeliPresnell, KeliTian, YinTian, YinGao, Gao, Alan
23、 E.Alan E.Tomkinson, LiyaTomkinson, LiyaGu, and Gu, and Guo-MinGuo-MinLiLi“在纯化后的系统中重构人类在纯化后的系统中重构人类5方向修复系统方向修复系统”-李国民李国民美国肯塔基大学的副教授美国肯塔基大学的副教授这一系统包括了这一系统包括了MutS或者或者MutS、MutL、RPA、PCNA、EXO1、HMGB1、RFC和和DNA聚合酶聚合酶蛋白,缺乏蛋白,缺乏MutL蛋白蛋白EXO1就会无法停止作用而切除过多的就会无法停止作用而切除过多的DNA。这一研究描述了一种由错配引起的这一研究描述了一种由错配引起的DNA切切除的启
24、始和终止模式。除的启始和终止模式。将真核系统错配修复系统中MutL的作用机理进行了进一步的阐明,是MutL使EXO1失去酶切的活性,从而使切除反应终止。这对于错配修复系统是否能正常工作是一个关键的步骤。重组修复重组修复子链复制时跳过损伤区段,留下缺口,由模板琏的同源链对应片段移至子链缺口填补空缺。再合成片段填补同源链。SOS修复修复(SOSrepair)SOS修复修复是指是指DNA受到严重损伤、细胞处受到严重损伤、细胞处于危急状态时所诱导的一种于危急状态时所诱导的一种DNA修复方式。修复方式。它是一种旁路系统它是一种旁路系统. 这是一种带来差错的修复,认为是细菌对外界环境的应急反应,故称修复系
25、统。损伤较大时损伤较大时(如产生很多的如产生很多的T=T),正常的,正常的DNA多聚酶复制到损伤位点时,其活性受多聚酶复制到损伤位点时,其活性受到抑制,短暂抑制后产生一种新的到抑制,短暂抑制后产生一种新的DNA多多聚酶,由于其修复校正功能较低,新合成聚酶,由于其修复校正功能较低,新合成的的DNA碱基错配频率较高,易引起突变。碱基错配频率较高,易引起突变。通过操纵子通过操纵子(结构基因、启动子、操纵基因、结构基因、启动子、操纵基因、调节基因调节基因)来实现:来实现:A.SOS基因:基因:recA基因、基因、UvrA、UvrB、UmuC等,也称等,也称din基因基因(damageinducible
26、gene),为操纵子的结构基因;为操纵子的结构基因;B.lex基因:阻遏蛋白基因,正常情况基因:阻遏蛋白基因,正常情况下结合在操纵基因上;下结合在操纵基因上;C.recA基因:重组蛋白基因,应急状态基因:重组蛋白基因,应急状态下启动蛋白质水解酶活性,水解阻遏蛋白,下启动蛋白质水解酶活性,水解阻遏蛋白,使使din基因高效表达,从而启动基因高效表达,从而启动SOS修复系修复系统统Mostcellspossess5differentcategoriesofDNArepairsystem1Directrepair2Excisionrepair3Mismatchrepair4Recombinationr
27、epair5SOSrepair DNA突变类型及后果突变类型及后果 DNA mutation types and consequencesw点突变(点突变(dotmutation) 转转换换(transition)同同型型碱碱基基的的取取代代。 Same-type bases substitution 颠颠换换(transversion)异异型型碱碱基基的的取取代代。 Different-type bases substitution 缺失缺失(deletion)一个或多个核苷酸)一个或多个核苷酸的丢失的丢失。Oneormorenucleotideacidloss插入(插入(insertion
28、)一个或多个核苷酸)一个或多个核苷酸的增加的增加。Oneormorenucleotideacidincrease同义突变(同义突变(samesensemutation)不改变氨基不改变氨基酸的密码子变化,与密码子的兼并性有关酸的密码子变化,与密码子的兼并性有关.如如GAU/GACAsp.Doesnotchangetheaminoacidcodonchanges,andtheannexationofthecodon.错义突变(错义突变(mis-sensemutation)导致氨导致氨基酸组成和排列发生改变的基因突变基酸组成和排列发生改变的基因突变。Genemutationwhichcausest
29、hechangeofaminoacidcompositionandarrangement无义突变(无义突变(non-sensemutation)一个一个核苷酸的改变可能使代表某个氨基酸的密码核苷酸的改变可能使代表某个氨基酸的密码子变成终止密码子(子变成终止密码子( UAA UAA 、 UAGUAG、UGAUGA),使),使蛋白质合成提前终止蛋白质合成提前终止. . One nucleotide acid change possibly causes to represent some codon of amino acid turn to termination codon (UAA, UAG
30、, UGA), which causes the protein synthesis to terminate ahead of time .移码突变(移码突变(frameshiftingmutation)使阅读框移动的基因突变使阅读框移动的基因突变.GenemutationCausedbythemovementofreadframe.通读突变(通读突变(readthroughmutation)-突突变将终止密码转变为一个编码氨基酸的密码变将终止密码转变为一个编码氨基酸的密码子,造成终止信号的通读子,造成终止信号的通读。Themutationcouldconvertaterminationco
31、donintoonespecifyinganaminoacid,resultinginreadthroughofthestopsignalsotheproteinisextendedbyanadditionalseriesofaminoacidsatitsCterminus.基因损伤引起mRNA阅读框架内的碱基发生插入或缺失,可能导致框移突变(frameshift mutation)。 沉默突变沉默突变(silentmutation)、)、中性突中性突变(变(neutralmutation)-即指不引起即指不引起明显表型变化的变异,无蛋白质功明显表型变化的变异,无蛋白质功能改变。能改变。Doe
32、snotcausetheobviousphenotypechangeofDNAvariation,non-proteinfunctionchange. 突变对功能的影响突变对功能的影响 Mutation on the function引起蛋白质结构发生改变,导致功能改变引起蛋白质结构发生改变,导致功能改变的的变异为变异为致病突变致病突变(disease-causingmutation)。)。DNAvariationforwhichcausesthechangeofproteinstructureandfunctioncalleddisease-causingmutation突变热点(突变热点(
33、hotspotofmutation)基因中基因中某些位点比其它位点突变率高某些位点比其它位点突变率高. 第二节第二节 基因组基因组一一个个物物种种的的单单倍倍体体染染色色体体数数目目,称称该该物物种种的基因组的基因组(genome)。(细细胞胞或或生生物物体体的的一一套套完完整整的的单单倍倍体体遗遗传传物物质的总和称为基因组质的总和称为基因组)Genomewasdefinedasthehaploidchromosomesofonespecies基因组指单倍体细胞中包括编码序列和非基因组指单倍体细胞中包括编码序列和非编码序列在内的全部编码序列在内的全部DNA分子。分子。Haploidcellge
34、nomeshouldrefertoincludecodingsequencesandnon-codingsequencesofallDNA核基因组核基因组Nucleargenome线粒体基因组线粒体基因组Mitochondrialgenomes叶绿体基因组叶绿体基因组Chloroplastgenome原核生物基因组原核生物基因组Prokaryoticgenome1.单单 一一 染染 色色 体体 、 基基 因因 数数 量量 较较 少少 . Singlechromosome,lessnumberofgenes.2. 功功能能相相似似的的基基因因往往往往定定位位在在同同一一区区域域(操操纵纵子子结结
35、构构 ) The similar functional genes usuallylocatedinthesameregion,suchasoperon.3.多多为为单单拷拷贝贝基基因因(单单一一顺顺序序基基因因)Mostofthemaresinglecopygene(singleordersequence).4. 绝绝大大多多数数基基因因都都是是可可表表达达的的,非非表表达达基基因因少少. Massofthemareexpressional,fewofnon-expressionalgene5. 转转录录产产物物为为多多顺顺反反子子mRNAThetranscriptionunitsmostl
36、yarepolycistronicmRNA.6. 编编码码顺顺序序一一般般不不重重叠叠Generally do not overlapcodingsequence7. 基基因因序序列列是是连连续续的的,无无内内含含子子。Thesequenceareuninterruptedandnointronsremainingenes. iOperonRegulatory GenepozyaDNAm-RNA-GalactosidasePermeaseTransacetylaseProteinA lactose operon consists of three structural genes :lacZC
37、ontrol elementscodes for -galactosidase , for hydrolyzing lactose galactose + glucose-5 +21repressorGenetic map of bacteriophage x174 hepatitis B virus, HBV 质粒质粒(plasmid) 细细胞胞染染色色体体以以外外具具有有自自主主复复制制能能力力的的环环状状DNA分子,称为质粒分子,称为质粒(plasmid)。 Plasmids are extrachromosomal double-strandedDNAthataregenerallyc
38、ovalentlyclosed and supercoiled circles. plasmidscanreplicateautonomously.质粒对于宿主细胞的生存不是必需的,但质粒中质粒对于宿主细胞的生存不是必需的,但质粒中含有某些基因,可左右细胞的生物特性含有某些基因,可左右细胞的生物特性.Plasmidsarenonessentialforthehosttolive,butmostplasmidscarrygenesthattransferphenotypeofthehost.Classificationbyfunction R质粒质粒 F质粒质粒col质粒质粒Rplasmidsc
39、arrygenesthatmakingthehostcellkeepingresistanttotherelevantantibiotic.F plasmids:fertility factor can determinebacterialsex;ActsasadonorinconjugationColplasmidsendowE.colitosecretecolicintokillthebacteriathatdontcontaintheplasmids. Classification on the basis ofmechanism: 严紧型质粒严紧型质粒(Stringentplasmid
40、) 松驰型质粒松驰型质粒(relaxedplasmid) F F 因子因子( ( fertlity factor ) 接合作用接合作用(conju(conjugagation)tion)高频重组株(High frequency recombination, Hfr). . 质粒虽然可以独立于染色体而进行复制,质粒虽然可以独立于染色体而进行复制,但复制只有在宿主细胞内才能够完成,一但复制只有在宿主细胞内才能够完成,一旦离开宿主就无法复制和扩增。旦离开宿主就无法复制和扩增。Althoughplasmidscanreplicateautonomously,replicationmustbecompl
41、etedinthehostcell.Oncedepartedfromthehost,plasmidscantreplicateandamplification质粒的特性:质粒的特性: Charactersofplasmidsl共共 价价 闭闭 合合 的的 环环 状状 DNA分分 子子 ( covalent closed circular DNA, cccDNA )l在在细细胞胞内内完完成成其其复复制制 Replicationinthehostl质粒可以转移质粒可以转移 Transferringabilityl具具有有不不相相容容性性(同同一一类类型型的的质质粒粒具具有有相相同同复复制制起起点点
42、和和分分配配区区,不不能能在在同同一一宿宿主主菌菌内内共存)共存) Incompatibility 二、二、真核生物基因组真核生物基因组eukaryotegenomeThesamecharacterstoprokaryoticgenomeareasfollow:1.genomeconsistsofDNA;2.genomecontainnumerousgenes;3.resemble mechanism of transcriptionandtranslation;4.geneticcodesareIdentical.1、多多个个染染色色体体(酵酵母母除除外外),结结构构复复杂杂,基基因因数数庞
43、庞大大。Multiple chromosomesexceptforyeast,complicatedstructure,hugenumberofgene.2、功功能能相相关关的的基基因因大大多多分分散散在在不不同同的的染染色色体体 上上 。 associated functional genesmostlylocatedindifferentchromosome.基因组特点:基因组特点: Differentcharacters3、转录产物为单顺反子,不存在操纵子结转录产物为单顺反子,不存在操纵子结构。构。Thetranscriptunitismonocistron,thereisnoopero
44、nremaininthegenome.4、非编码顺序非编码顺序(NCS)多于编码顺序多于编码顺序。non coding sequence (NCS) areexcessivetocodingsequence5、含有大量重复顺序。、含有大量重复顺序。所谓重复顺序是指在所谓重复顺序是指在基因组中多次反复出现的基因组中多次反复出现的DNA序列。高度序列。高度重复顺序(重复频率重复顺序(重复频率105,中度重复,中度重复10-104。containingabundantrepeatsequence.repeatsequenceareDNAsequencethatappearthroughandthro
45、ughingenome.Itcanbeclassifiedbyrepeatedrateintothreetypes:highlyrepeatedsequence;moderatelyrepeatedsequence;singlecopysequence.6、是断裂基因是断裂基因 (split gene)内内含含子子( intron )指指插插入入到到结结构构基基因因(编编码码顺序)之中的非编码顺序顺序)之中的非编码顺序。Intron is nonencoded sequence inserted structural gene.外外显显子子(exon)相相应应的的编编码码蛋蛋白白质质的的DNA
46、顺序称外显子顺序称外显子Exon is DNA sequence encoding protein.内含子存在于各类基因中内含子存在于各类基因中.一些基因具有一些基因具有不同剪接方式不同剪接方式,一个内含子在另一种情一个内含子在另一种情况下可能是外显子。况下可能是外显子。Intronsexistinginallsortsofgenedontencodeproteingenerally.theywereremovedbyalternativecleaving,oneinrtoncanbeactasexoninanothercondition7、 相相 关关 的的 基基 因因 构构 成成 各各 种
47、种 基基 因因 家家 族族(Genefamily)基基因因家家族族指指核核苷苷酸酸序序列列或或编编码码产产物物的的结结构具有一定同源性的一组基因。构具有一定同源性的一组基因。Genefamily are composed of many correlated genes that structure of sequence and encoded products are homology, 它们可相距很远,也可串联成蔟,均为它们可相距很远,也可串联成蔟,均为分别转录分别转录 which not only apart far from each other,but also tandem ex
48、ist in series,both of them transcribe respectively.假基因假基因:类似于基因但不表达的:类似于基因但不表达的DNA序序列。列。Pseudogene:DNAsequencethatissimilartogenes,butnottoexpress.不表现任何功能,是基因的退化形式不表现任何功能,是基因的退化形式。havenofunction,actingasdegenerationofgenes.在在很很多多情情况况,一一个个DNA序序列列可可以以产产生生多多个个mRNA序序列列,需需要要依依据据它它所所选选择择的的表表达途径而定。达途径而定。Us
49、ually, there is no fixed relationbetween genes and protein. strand ofDNA produce many mRNAs, methods.becauseofmanysplicingmanner.病毒基因组类型病毒基因组类型(typesofviralgenome).双链(双链(doublestrandedDNAdsDNA)、单链(、单链(singlestrandedDNAssDNA)、双链双链(doublestrandedRNAdsRNA) 三、三、 病毒基因组病毒基因组 viral genome、单链负股(单链负股(singlem
50、inusstrandedDNA,ss-RNA)5、单链正股单链正股(singleplusstrandedRNAss+RNA)6.双链双链DNA并有并有RNA中间体中间体(doublestrandedDNAwithRNAintermediate)7.正股正股RNA并有并有DNA中间体中间体(plusstrandedRNAwithDNAintermediate)病毒基因组的特点病毒基因组的特点(characteristicofviralgenome)1.基因组小,结构简单。但不同病毒基基因组小,结构简单。但不同病毒基因组相差甚大因组相差甚大Genomeissmallandstructureissi
51、mple.Thereisquitevariantindifferentviralgenome乙肝病毒:乙肝病毒:3.2kb,几种蛋白质,几种蛋白质痘病毒:痘病毒:300kb,几百种蛋白质,几百种蛋白质。2基因组由基因组由DNA或或RNA组成组成genomeconsistsofDNAorRNA双链或单链双链或单链doublestrandorsinglestrand环形或线形环形或线形annuliformorfilate3基因重叠多见基因重叠多见Mostofthemareoverlappinggene完全重叠完全重叠completelyoverlapping部分重叠部分重叠partialoverl
52、apping所谓所谓重叠基因重叠基因(overlappinggene)是指是指两个或两个以上的基因共有一段两个或两个以上的基因共有一段DNA序列,序列,或是指一段或是指一段DNA序列成为两个或两个以上序列成为两个或两个以上基因的组成部分。基因的组成部分。ThetermoverlappinggenemeanstwoorovertwogenesownasegmentDNAsequence,orasegmentDNAsequenceis composed of twoorovertwogenes4重复顺序少重复顺序少 little repetitive sequence5非编码区少,编码区多(大于非
53、编码区少,编码区多(大于90%) little noncoding region, Much coding region (exceed 90%)6.除除逆转录病毒逆转录病毒基因组有两个拷贝外,基因组有两个拷贝外,其它都是单倍体其它都是单倍体Exceptretrovirusgenomewhichhastwocopies,othersarehaploids稳定性稳定性 不不同同民民族族、群群体体、个个体体具具有有相相同同数数目目的的染染色色体体,相相同同数数量量的的基基因因,相相同同的的基基因分布以及基本相同的核苷酸顺序。因分布以及基本相同的核苷酸顺序。 Stability :Different
54、 nations, folks andindividuals have the same number ofchromosome and gene, the samedistribution of gene, and basically thesamenucleotideacidsequence 四、四、人类基因组人类基因组human genome基基因因组组总总长长度度约约3109bp,约约3.5万万个个编编码码基因。编码基因约占基因。编码基因约占3%。There are approximately 3109bp incompletesequence,about3.5000codegenes
55、编编码码蛋蛋白白质质的的结结构构基基因因仅仅仅仅占占基基因因组组3左右并多以单拷贝形式存在。左右并多以单拷贝形式存在。thegenecodingproteinonlyaccountforthreepercentingenomeandexistinsinglecopyform.大大多多数数DNA序序列列为为基基因因之之间间,基基因因内内的的插插入序列和各种重复顺序。入序列和各种重复顺序。restofDNAsequencemostlyareinsertsandrepeatsliedininteriorandinterspaceofgene(一)重复顺序一)重复顺序RepetitiveSequenc
56、e1. 倒倒 位位 ( 转转 ) 重重 复复 顺顺 序序 (invertedrepeats) 倒倒位位(转转)重重复复顺顺序序是是指指两两个个顺顺序序相相同的互补拷贝在同的互补拷贝在DNA链上呈反向排列。链上呈反向排列。InvertedSequenceTwoidenticalcomplementarycopiesarearrangedalongDNAchainreversely.l 发夹式结构发夹式结构Barrette-likestructurel 回文结构回文结构Palindrome2.串联重复顺序(串联重复顺序(Tandemrepeatsequence)具具有有一一个个固固定定的的重重复复
57、单单位位并并头头尾尾相相连连。是是一一类高度重复顺序,占基因组类高度重复顺序,占基因组10左右。左右。Multiplerepeatsofidenticalcopiesfollowoneanotherdirectly(tandemrepeated),akindofhighlyrepetitivesequence,accountsforabout10%ofgenome。卫星卫星DNAsatelliteDNA.Theyareakindofhighlyrepetitivesequenceaccountingfor10percentthroughoutthegenome SatelliteDNA 在在s
58、Cl密密度度梯梯度度离离心心时时发发现现 Identified in CsCl density gradient 。 经经典典的的卫卫星星DNA,又又分分为为、和和、卫星卫星DNA.Macro satellite DNA: classic satellite DNA was classified into 、 and 、satellite DNASatellite DNAMouse genome DNA30% GC in satellite DNAD4 Genome ComplexityCsCl centrifugation l小卫星小卫星DNA(小卫星由(小卫星由6-40bp串联串联重复短顺
59、序组成。重复单位的数目从几次重复短顺序组成。重复单位的数目从几次到几百次不等到几百次不等)MinisatelliteDNA:repeatunitsconsistof4-60bp The number of repeat units isfromseveraltohundredstimes. 微卫星微卫星DNA icro-satellite DNA()()微卫微卫星由更短的重复单位串联而成,如星由更短的重复单位串联而成,如(CA)n、(GATA)n。微卫星中重复单位数目是高度变异。微卫星中重复单位数目是高度变异的。因此的。因此,微卫星显示了高度长度多态性。微卫星显示了高度长度多态性。Thesho
60、rtestrepeatunitssuchas(CA)n,(GATA)n。thatistheyvarysignificantlyinlengthbetweenindividualswhichisknownasMSlengthpolymorphisms 对对等等位位基基因因进进行行家家系系分分析析,发发现现它它们们遵遵照照孟孟德德尔尔遗遗传传规规律律,是是一一套套新新的的遗遗传传标标记记系系统。统。FamilyanalysisforMSallelesfoundthatMendel laws can apply to MS so theybecameanewsystemofgeneticmarker
61、3.散在散在重复顺序重复顺序 Dispersedrepeatsequence 散散在分布于基因组中的重复序列在分布于基因组中的重复序列.Scatteredinthegenomeoftherepeatsequence短分散重复序列短分散重复序列(shortinterspersednuclearelements,或或shortinterspersedrepeatedsequences,SINEs),长度在长度在500bp以下以下.Aluelement长散在重复序列长散在重复序列(longinterspersednuclearelements或或longintersperedrepeatedsequ
62、ences,LINEs),长度在长度在500bp以上以上.KpnelementAlu elementAlu序列具有种特异性,以人的序列具有种特异性,以人的Alu序列制序列制备的探针只能用于检测人的基因组中的备的探针只能用于检测人的基因组中的Alu序列,由于在大多数的含有人的序列,由于在大多数的含有人的DNA的克的克隆中都含有隆中都含有Alu序列,因此,可用以人的序列,因此,可用以人的Alu序列制备的探针与克隆杂交来进行筛选。序列制备的探针与克隆杂交来进行筛选。多态性多态性 长长期期进进化化过过程程中中基基因因组组的的变变异异产产生生多多态态性。性。Polymorphism: Mutation
63、of genomeresultingenomicpolymorphisminlongevolution.1.串联重复顺序多态性串联重复顺序多态性可可 变变 数数 串串 联联 重重 复复 序序 列列 多多 态态 性性 (Variablenumberoftandemrepeats,VNTRs)。主主要要发发生生在在小小卫卫星星和和微微卫卫星星DNA中中。在在人人群群中中有有极极高高的频率的频率tandemrepeatsVNTRsVariablenumberoftandemrepeatsVNTRsmainlyoccurintheminisatellitesandmicrosatellitesbyhi
64、ghfrequencyingroup(二)(二)DNADNA多态性多态性 DNA polymDNA polymo orphismrphismVNTRs是是按按孟孟德德尔尔规规律律遗遗传传的的,作作为为基基因因座座位位的的遗遗传传标标记记。在在疾疾病病基基因因携携带带者者检检测测、产产前前诊诊断以及法医学上有重要价值。断以及法医学上有重要价值。VNTRsinheritedaccordingtoMendellawshavingtwofeatures:SomaticstabilityandSpeciesstability.Asthegeneticmarkersofgenelocus,theyplay
65、animportantroleinthemedicaljurisprudenceandthediagnosisofgeneticdiseases2、限制性片段长度的多态性限制性片段长度的多态性(restrictionfragmentlengthpolymorphism,RFLP)当当DNADNA碱基组成的变化改变了限制酶识别碱基组成的变化改变了限制酶识别位点时,用限制酶酶切,会得到不同的限制位点时,用限制酶酶切,会得到不同的限制片段类型片段类型。 WhenthecompositionvarietyofDNAbaseschangedtherestrictionenzymerecognitionp
66、osition,cutswiththerestrictionenzymeenzyme,willobtainthedifferentlimitedfragmenttype 通过限制酶酶切片段的长度多态性来通过限制酶酶切片段的长度多态性来揭示揭示DNADNA碱基组成不同的技术简称碱基组成不同的技术简称RFLPRFLP技术。技术。 Cut fragment of the length polymorphism throughtherestrictionenzymetopromulgatethedifferentcompositionofDNAbases,which is the basis of t
67、he technology of the restrictionfragmentlengthpolymorphism(RFLP),DNA指纹分析。指纹分析。DNAfingerprintanalysis. RFLP(RestrictionFragmentLengthPolymorphisms)3、单核苷酸多态性、单核苷酸多态性(single-nucleotidepolymorphism,)出现在基因组分子的特定位置出现在基因组分子的特定位置的单个核苷酸的置换的单个核苷酸的置换replacementofsinglenucleotideacidappearsinthespecificposition
68、ofgenomeDNAmolecule.w定义位点必须满足该位点的定义位点必须满足该位点的变变异在人群中出现的频率大于异在人群中出现的频率大于 w Define a SNP position must Define a SNP position must suffice the frequency of the suffice the frequency of the variation of this position variation of this position appears more than 1% in publicappears more than 1% in public
69、年由麻省理工学院年由麻省理工学院 Lande ES提出提出。按核甘酸置换类型,包含有按核甘酸置换类型,包含有:Accordingtothenucleusacidreplacementtype,SNPcontains:G/A,C/T,G/T,A/C,A/T和G/C.是人类基因组内最为广泛的遗传变异,是人类基因组内最为广泛的遗传变异,占多态性的占多态性的Itisthemostwidespreadhereditaryvariationinthehumangenome,occupies90%ofDNApolymorphism)SNPWhatisaSNP?发生在基因内和调节区的发生在基因内和调节区的SN
70、P可影响基可影响基因功能。因功能。Intheinsideofgeneandregulationarea,SNPmayaffectthegenefunction.同时,同时,SNP也是目前用于寻找疾病易感也是目前用于寻找疾病易感基因的重要遗传标记。基因的重要遗传标记。Atthesametime,SNPisalsotheimportantgeneticmarkerusesinseekingfordiseasesusceptibilitygeneatpresent基因检测示例基因检测示例exampleofgenedetection基因组学基因组学(Genomics)是阐明基因组结构、结构与功能的关是
71、阐明基因组结构、结构与功能的关系以及基因与基因之间的相互作用的系以及基因与基因之间的相互作用的科学科学.Expoundsthegenomestructure,relationsbetweenthestructureandthefunctionaswellasinteractionsbetweenthegeneandthegenescience.主要内容包括主要内容包括:结构基因组学结构基因组学Structuralgenomics功能基因组学功能基因组学Functionalgenomics比较基因组学比较基因组学comparativegenomics随着基因组研究的深入,一系列基因组随着基因组研
72、究的深入,一系列基因组学也应运而生,如:学也应运而生,如:环境基因组学环境基因组学(enviromentalgenomics)行为基因组学行为基因组学(behavioralgenomics)营养基因组学营养基因组学(nutritionalgenomics)药物基因组学药物基因组学(pharmacogenomics)人类基因组计划(HGP)DuchenneDuchenne肌营养不良症肌营养不良症(假性(假性肌肌肥大型)肥大型)白化病患者白化病患者21三体综合症患儿(先天愚型)唇裂与腭裂第四节第四节基因组变异与人类疾病基因组变异与人类疾病1单单单单基基基基因因因因病病病病2多多多多基基基基因因因因
73、病病病病3获获获获得得得得性性性性基基基基因因因因病病病病基因病分类基因病分类(Classificationofgenicdisease)疾病的分子机制疾病的分子机制.单基因遗传病与致病基因单基因遗传病与致病基因singlegeneinheritancediseaseandvirulencegene基因组某单个基因座(基因组某单个基因座(locus)上存在缺陷基因)上存在缺陷基因所引起的一类遗传病称为单基因遗传病。所引起的一类遗传病称为单基因遗传病。(6000余种余种)Theflawgeneonsomesinglelocusofgenomecausesakindofhereditarydise
74、asecalledsinglegeneinheritancedisease红绿色盲、血友病等红绿色盲、血友病等疾病特点是疾病特点是:表型表型(phaenotype)与与缺陷缺陷基因之间存在确定的对应关系。基因之间存在确定的对应关系。这种与表型有确定的一一对应关系的基这种与表型有确定的一一对应关系的基因称为因称为致病基因(致病基因(disease-causinggene)Phenotypeandtheflawgenehasthedefinitecorrespondingrelationships。Thisgenecalleddisease-causinggene复杂性状疾病与疾病易感基因复杂性状
75、疾病与疾病易感基因Comlexdiseaseandsusceptibilitygenetodisease由遗传和环境相互作用所决定的生物性状称复由遗传和环境相互作用所决定的生物性状称复杂性状(杂性状(complextraits)Thebiologicalcharacterwhichdecidedbytheheredityandtheenvironmentinteractioncalledcomplextraits一种基因型一种基因型(genetype)可产生若干不同的可产生若干不同的表现型表现型(phenotype),或相反,一种表现,或相反,一种表现型可能由若干基因型所影响型可能由若干基因型
76、所影响。Onegenetypecouldbringsomeanotherphenotype,oronephenotypecouldinfluencedbysomegenetype.基因型基因型与与表型表型非非“一对一一对一”genetypeandPhenotypearenotonevsone.与单基因性状比较,复杂形状特点:与单基因性状比较,复杂形状特点:TheCharacteristicsofcomplexcharactercomparedwithmonogeniccharacter)表型由遗传因素和环境因素共同决定)表型由遗传因素和环境因素共同决定Thephenotypeisdetermi
77、nedbythehereditaryfactorandenvironmentalfactortogether遗传度(遗传度(heritability)人群中遗传人群中遗传因素造成表型变异占总的表型变异的比因素造成表型变异占总的表型变异的比例例(单基因遗传病的遗传度为单基因遗传病的遗传度为100%)。)。哮喘病遗传度为哮喘病遗传度为80精神分裂症为精神分裂症为80高血压遗传度为高血压遗传度为62冠心病遗传度为冠心病遗传度为65糖尿病遗传度(幼年型)为糖尿病遗传度(幼年型)为75糖尿病遗传度(老年型)为糖尿病遗传度(老年型)为35唇裂腭裂遗传度为唇裂腭裂遗传度为762)遗传方式为非遗传方式为非Me
78、ndelian遗传遗传在一级亲属中的患病风险一般仅为在一级亲属中的患病风险一般仅为5%-15%,低于孟德尔阴性遗传病的低于孟德尔阴性遗传病的1/4。Non-Mendeliangeneticinheritancemode3)由多基因控制,根据功能可分为)由多基因控制,根据功能可分为主基因主基因(maiorgene)、)、微效基因微效基因(minorgene)和)和修饰基因修饰基因(modifiergene)Controlledbymultiplegenes复杂性状的致病基因称为易感基因复杂性状的致病基因称为易感基因(susceptibilitygene)。)。多基因涉及的确切基因数目难以回答多基
79、因涉及的确切基因数目难以回答。Thetheaccurategenenumberinwhichpolygenesinvolvesisdifficulttoreply.易感基因的概念与单基因病的致病基因易感基因的概念与单基因病的致病基因有明显区别有明显区别:ThereareobviousdifferencesbetweenConceptsofpredisposinggenesandvirulencegeneofmonogenicdisorder前者注重疾病的患病风险和可能性;前者注重疾病的患病风险和可能性;Theformerpaysattentiontotheriskandpossibilityo
80、fdisease后者是致病的原因所在甚至是惟一的原后者是致病的原因所在甚至是惟一的原因因。Thelatteristhepathogenicreasoneventheonlyreason基因变异与肿瘤基因变异与肿瘤Genemutationandcancer肿瘤的形成与否取决于机体中癌基因和抑癌肿瘤的形成与否取决于机体中癌基因和抑癌基因的平衡,抑癌基因突变会致癌基因的平衡,抑癌基因突变会致癌。一些诱变剂一些诱变剂可以特异性的诱导抑癌基因突变,导致肿瘤发生。可以特异性的诱导抑癌基因突变,导致肿瘤发生。eg.黄曲霉素可诱导黄曲霉素可诱导P53基因基因GT颠换,导颠换,导致肝癌的发生;致肝癌的发生;UV
81、可诱导可诱导P53基因基因5-TC-3发发生生CT颠换,形成颠换,形成“T二聚体二聚体”,导致人类鳞,导致人类鳞状细胞皮肤癌的发生。状细胞皮肤癌的发生。結語基因组是细胞或生物体中一套完整单倍基因组是细胞或生物体中一套完整单倍体的遗传物质的总称体的遗传物质的总称。Thegenomeisageneralnameofthehereditarymaterialsofasetofcompletehaploidinincellsororganism同一生物,除精细胞和卵细胞外同一生物,除精细胞和卵细胞外,所有所有细胞都具有相同的遗传信息细胞都具有相同的遗传信息Thesamebiological,excep
82、tthespermcellandtheeggcell,allcellshavethesamegeneticinformation原核生物、真核生物和病毒基因组都有各原核生物、真核生物和病毒基因组都有各自的特点自的特点Prokaryotes,eukaryoticandviralgenomeshavetheirowncharacteristics人类基因组是一个十分稳定的体系,但是人类基因组是一个十分稳定的体系,但是在长期进化过程中基因组的变异会产生多在长期进化过程中基因组的变异会产生多态性。态性。Humangenomeisaverystablesystem,butinthelongtermevo
83、lutiongenomemutationswerepolymorphic.基因组的遗传变异是人类遗传多样性的基因组的遗传变异是人类遗传多样性的基础基础,也是单基因遗传病的的重要原因也是单基因遗传病的的重要原因.ThehereditaryvariationofHumangenomesafoundationofhumangeneticdiversityandimportantcauseofsinglegeneinheritancediseaseSNP是人群中体现个体差异的最基本的是人群中体现个体差异的最基本的遗传变异遗传变异.是疾病易感差异的遗传学基础是疾病易感差异的遗传学基础.SNPisthem
84、ostbasichereditaryvariationoftheindividualdifferenceinthecrowd.Itisahereditaryfoundationofsusceptivitytodiseaseamongacrowdorindividual同时也是重要的遗传标记同时也是重要的遗传标记.Itistheimportantgeneticmarkatthesametime复杂疾病的易感基因一般包含了一组微复杂疾病的易感基因一般包含了一组微效基因效基因,它不是决定疾病本身它不是决定疾病本身,而是对疾病而是对疾病的遗传易感性的遗传易感性.Thepredisposinggeneo
85、fcomplexdiseasegenerallyincludesagroupofminorgene.itdoesnotdeterminedisease,buttheGeneticsusceptibilitytodisease复杂疾病的发病取决于遗传因素的累加效复杂疾病的发病取决于遗传因素的累加效应和与环境的相互作用应和与环境的相互作用ThemorbidityofthecomplexdiseasedependsontheaccumulationeffectofthehereditaryfactorandtheinteractionofhereditaryfactorandenvironmentThank you!本教学本教学课件使用的件使用的图片部分来自同行片部分来自同行专家家的的发表表论文和教学研究成果,在此一并文和教学研究成果,在此一并致致谢!