《人类复杂疾病与计算系统生物学行业研究》由会员分享,可在线阅读,更多相关《人类复杂疾病与计算系统生物学行业研究(66页珍藏版)》请在金锄头文库上搜索。
1、哈尔滨医科大学哈尔滨医科大学 李霞李霞第十四章 人类复杂疾病与计算系统生物学Human Complex Disease and Computational Systems Biology第一节 引言n n人人人人类类常常常常见见病,包括病,包括病,包括病,包括肿肿瘤、心瘤、心瘤、心瘤、心脑脑血管病、代血管病、代血管病、代血管病、代谢谢系系系系统统疾病、神疾病、神疾病、神疾病、神经经系系系系统统疾病、精神和行疾病、精神和行疾病、精神和行疾病、精神和行为为异常等异常等异常等异常等绝绝大多大多大多大多数都是复数都是复数都是复数都是复杂杂性疾病。复性疾病。复性疾病。复性疾病。复杂杂疾病与疾病与疾病与疾
2、病与单单基因缺陷性基因缺陷性基因缺陷性基因缺陷性遗遗传传病不同,不符合孟德病不同,不符合孟德病不同,不符合孟德病不同,不符合孟德尔尔定律,疾病的定律,疾病的定律,疾病的定律,疾病的发发生生生生发发展展展展涉及复涉及复涉及复涉及复杂杂的生物学的生物学的生物学的生物学过过程,是程,是程,是程,是2121世世世世纪纪生物医学重大生物医学重大生物医学重大生物医学重大的挑的挑的挑的挑战战之一。之一。之一。之一。IntroductionIntroductionn n虽然我然我们积累了大量的累了大量的资料和数据,亦取得众多研料和数据,亦取得众多研究成果,但究成果,但对复复杂疾;病疾;病本本质的的认识还相距甚
3、相距甚远。n n但是生物科学、但是生物科学、计算机技算机技术的迅速的迅速发展展为我我们研究研究复复杂疾病提供了疾病提供了崭新的契新的契机。机。n n组学和系学和系统生物学生物学的不断的不断发展展为我我们从分子水平的多从分子水平的多层面去研究复面去研究复杂疾病疾病提供了有力的条件,提供了有力的条件,也使得医学也使得医学进入了入了崭新的新的时代。代。n n本章的主要内容本章的主要内容n n复杂疾病相关的基本概念和知识复杂疾病相关的基本概念和知识n n几个常用的复杂疾病知识库几个常用的复杂疾病知识库n n复杂疾病研究的系统生物学方法复杂疾病研究的系统生物学方法第二节 复杂疾病概述n n疾病是机体在一
4、定病因的疾病是机体在一定病因的损害作用下,因机体害作用下,因机体自自稳调节(homeostasis)紊乱而紊乱而发生的异常生生的异常生命活命活动过程。多数疾病,机体程。多数疾病,机体对病因所引起的病因所引起的损害害发生一系列抗生一系列抗损害反害反应;自;自稳调节的紊乱,的紊乱,损害和抗害和抗损害反害反应,表,表现为疾病疾病过程中各种复程中各种复杂的机能、代的机能、代谢和形和形态结构的异常构的异常变化,而化,而这些些变化又可使机体各器官系化又可使机体各器官系统之之间以及机体与以及机体与外界外界环境之境之间的的协调关系关系发生障碍,从而引起生障碍,从而引起各种症状、体征和行各种症状、体征和行为异常
5、,特异常,特别是是对环境适境适应能力和体力减弱甚至能力和体力减弱甚至丧失。失。疾病遗传物质的变异(内因)遗传物质的变异(内因)染色体异常基因突变单核苷酸多态和插入缺失多态拷贝数变异DNA修饰和核小体修饰等外界环境变化(外因)外界环境变化(外因)感染损伤环境情绪和情感教育和社会一、孟德尔遗传疾病与复杂疾病一、孟德尔遗传疾病与复杂疾病n n由由单一基因缺陷或由主基因缺陷而引起的一基因缺陷或由主基因缺陷而引起的遗传疾病,叫做孟德疾病,叫做孟德尔遗传疾病。孟德疾病。孟德尔遗传疾病的疾病的遗传模式基本模式基本满足孟德足孟德尔遗传定律。定律。?二、复杂疾病涉及多基因和蛋白二、复杂疾病涉及多基因和蛋白n n
6、复复杂疾病(疾病(complex disease),又称多基),又称多基因病(因病(ploygenic disorder),是指由多个),是指由多个基因位点共同参与,且和基因位点共同参与,且和环境因素相互作境因素相互作用决定表型的用决定表型的遗传疾病。众所周知,像高疾病。众所周知,像高血血压,哮喘和某些癌症的,哮喘和某些癌症的发病通常不病通常不仅是是由由单个基因突个基因突变导致,而是众多基因通致,而是众多基因通过蛋白蛋白质复合物,复合物,调控网控网络以及互作通路来以及互作通路来控制的。控制的。protein-gene interactionsprotein-protein interactio
7、nsPROTEOMEGENOMECitrate CycleMETABOLISMBio-chemical reactions人民卫生出版社8年制及7年制临床医学等专业用生物信息学n nDingDing等人在等人在等人在等人在20082008年研究了和年研究了和年研究了和年研究了和188188中人中人中人中人类类肺部癌肺部癌肺部癌肺部癌变变的的的的623623个个个个已知或潜在相关的基因,并利已知或潜在相关的基因,并利已知或潜在相关的基因,并利已知或潜在相关的基因,并利用系用系用系用系统统生物学的方式从中生物学的方式从中生物学的方式从中生物学的方式从中筛选筛选出和肺癌出和肺癌出和肺癌出和肺癌显显著
8、高著高著高著高频频的的的的2626个基因个基因个基因个基因。其中,。其中,。其中,。其中,NF1NF1、APCAPC、RB1RB1、ATMATM等基因的突等基因的突等基因的突等基因的突变变,LRP1BLRP1B序列的缺失以及序列的缺失以及序列的缺失以及序列的缺失以及PTPRDPTPRD序列序列序列序列的的的的该该表都是表都是表都是表都是诱导诱导肺癌肺癌肺癌肺癌发发生的原生的原生的原生的原因。同因。同因。同因。同时时,DingDing等人也等人也等人也等人也发现发现了和肺癌相关的一些重要的信了和肺癌相关的一些重要的信了和肺癌相关的一些重要的信了和肺癌相关的一些重要的信号通路如号通路如号通路如号通
9、路如MAPKMAPK、p53p53、WNTWNT和和和和mTORmTOR。三、复杂疾病受环境因素影响n n复复杂疾病不疾病不仅与基因和蛋白有关,与周与基因和蛋白有关,与周围环境同境同样有着非常密切的关系。有着非常密切的关系。n n同一个体在不同条件下同一个体在不同条件下对环境的响境的响应不同。不同。例如例如细胞受到紫外胞受到紫外线照射或受到照射或受到环境毒素境毒素的作用后的癌的作用后的癌变现象。象。n n基因基因组的个体差异使不同人的个体差异使不同人对环境的响境的响应不同。每个人因不同。每个人因为在基因型上并不完全相在基因型上并不完全相同,同,对于于环境改境改变的敏感性也不同。的敏感性也不同。
10、n n越来越多的越来越多的实验证据据证明基因与明基因与环境之境之间的相互作用在复的相互作用在复杂疾病的疾病的发生生发展展过程中程中起着关起着关键性作用,它性作用,它们之之间的相互作用是的相互作用是极其复极其复杂和非和非线性的,一个相同的基因在性的,一个相同的基因在不同的不同的环境中会境中会产生不同甚至是完全相反生不同甚至是完全相反的表型,因此的表型,因此单纯从基因或蛋白等某一个从基因或蛋白等某一个角度去研究是不足以全面了解复角度去研究是不足以全面了解复杂性状疾性状疾病的病的发生、生、发展展过程的。程的。四、疾病的分类n nVictor A. McKusickVictor A. McKusick
11、博士于博士于博士于博士于19661966年开始年开始年开始年开始进进行行行行MIMMIM( Mendelian Mendelian Inheritance in Man Inheritance in Man )的)的)的)的创创作。作。作。作。n n世界世界世界世界卫卫生生生生组织组织(WHOWHO)于)于)于)于19481948年开始年开始年开始年开始负责负责ICDICD(International International Statistical Classification of Diseases and Related Health Statistical Classificatio
12、n of Diseases and Related Health ProblemsProblems)的)的)的)的编编写任写任写任写任务务。n n现现有版本(有版本(有版本(有版本(ICD-10ICD-10)包含)包含)包含)包含15.515.5万种万种万种万种编码编码。n n中国根据中国根据中国根据中国根据ICD-10ICD-10颁颁布了布了布了布了第二次国家第二次国家第二次国家第二次国家卫卫生服生服生服生服务调查务调查疾病分疾病分疾病分疾病分类类编码编码表表表表对对疾病疾病疾病疾病进进行了分行了分行了分行了分类类,共,共,共,共1919类类:传传染病;染病;染病;染病;寄生虫病;寄生虫病;
13、寄生虫病;寄生虫病;恶恶性性性性肿肿瘤;瘤;瘤;瘤; 良性良性良性良性肿肿瘤;瘤;瘤;瘤;内分泌疾病(内分泌疾病(内分泌疾病(内分泌疾病(营营养和代养和代养和代养和代谢谢疾病及免疫疾病)疾病及免疫疾病)疾病及免疫疾病)疾病及免疫疾病) ;血液血液血液血液和造血器官疾病;和造血器官疾病;和造血器官疾病;和造血器官疾病;精神病;精神病;精神病;精神病;神神神神经经系系系系统统疾病;疾病;疾病;疾病;眼及附器疾病;眼及附器疾病;眼及附器疾病;眼及附器疾病; 耳和乳突疾病;耳和乳突疾病;耳和乳突疾病;耳和乳突疾病; 循循循循环环系系系系统统疾病;疾病;疾病;疾病; 呼吸系呼吸系呼吸系呼吸系统统疾病;疾
14、病;疾病;疾病; 消化系消化系消化系消化系统统疾疾疾疾病;病;病;病; 泌尿生殖系泌尿生殖系泌尿生殖系泌尿生殖系统统疾病;疾病;疾病;疾病; 妊娠、妊娠、妊娠、妊娠、 分娩病及分娩病及分娩病及分娩病及产产褥期并褥期并褥期并褥期并发发症;症;症;症; 皮皮皮皮肤和皮下肤和皮下肤和皮下肤和皮下组织组织疾病;疾病;疾病;疾病; 肌肉、骨骼系肌肉、骨骼系肌肉、骨骼系肌肉、骨骼系统统和和和和结缔组织结缔组织疾病;疾病;疾病;疾病; 损伤损伤和中毒。和中毒。和中毒。和中毒。第三节复杂疾病数据库n n本本节将将对OMIM、GAD、CGAP等复等复杂疾病疾病数据数据库的内容及使用方法的内容及使用方法进行行简要
15、介要介绍n n这些数据些数据库主要基于文献、关主要基于文献、关联分析及生分析及生物学物学实验的的结果,果,记录了疾病表型、相关了疾病表型、相关的染色体区域、候的染色体区域、候选基因等多方面的信息。基因等多方面的信息。一、人类孟德尔遗传在线(OMIM)n nMIM (Mendelian Inheritance in Man)与与OMIMn nOMIM的的发展史展史n n目前目前,OMIM的的发布以及相关布以及相关软件的开件的开发由由National Center for Biotechnology Information (NCBI)负责。n nOMIM 数据数据库的的访问 http:/www.
16、ncbi.nlm.nih.gov/omimOMIM 主页主页(http:/www.ncbi.nlm.nih.gov/omim)MIMMIM编编号范号范号范号范围围遗传遗传方式方式方式方式100000-199999100000-199999常染色体常染色体常染色体常染色体显显性性性性遗传遗传或表型(于或表型(于或表型(于或表型(于19941994年年年年5 5月月月月1515号号号号创创建)建)建)建)200000-299999200000-299999常染色体常染色体常染色体常染色体隐隐性性性性遗传遗传或表型(于或表型(于或表型(于或表型(于19941994年年年年5 5月月月月1515号号号
17、号创创建)建)建)建)300000-399999300000-399999X X连锁连锁位点或表型位点或表型位点或表型位点或表型400000-499999400000-499999Y Y连锁连锁位点或表型位点或表型位点或表型位点或表型500000-599999500000-599999线线粒体位点或表型粒体位点或表型粒体位点或表型粒体位点或表型600000-600000-染色体位点或表型(于染色体位点或表型(于染色体位点或表型(于染色体位点或表型(于19941994年年年年5 5月月月月1515号号号号创创建)建)建)建)OMIM编号代表的遗传方式编号代表的遗传方式OMIMOMIM号前号前号前
18、号前特殊符号代表的含特殊符号代表的含特殊符号代表的含特殊符号代表的含义义:“*”号代表已知致病基因的序列信息,没有加“*”表示其遗传模式虽然已有推测,但没有被证实或者这个基因与其他记录所包含的基因位点的分离情况还不清楚; “#”表示这种表型可以由两个或者多个基因中的一个发生突变而引起; “+”表示这个记录包含基因的序列信息和表型; “%”表示记录中描述了一个已知的孟德尔表型,但是对其潜在的分子机制还不清楚; “”表示该记录已不存在或者被其他记录所代替。OMIM数据的下载数据的下载n nftp:/ftp.ncbi.nih.gov/repository/OMIM/ftp:/ftp.ncbi.nih
19、.gov/repository/OMIM/ 其中其中其中其中包含全部的包含全部的包含全部的包含全部的OMIMOMIM的文件(的文件(的文件(的文件(omim.txt.Zomim.txt.Z),),),),OMIMOMIM中的基因文件(中的基因文件(中的基因文件(中的基因文件(genemapgenemap)及其解)及其解)及其解)及其解释释文件文件文件文件(genemap.keygenemap.key),以及疾病信息),以及疾病信息),以及疾病信息),以及疾病信息(morbidmapmorbidmap)n nOMIMOMIM还还提供提供提供提供genemapgenemap和和和和morbidma
20、pmorbidmap的网的网的网的网络查询络查询形式形式形式形式genemap查询页面查询页面morbidmap查询页面查询页面OMIM数据库的使用数据库的使用(以(以Alzheimers Disease为例)为例)二、遗传关联数据库(GAD) GAD (Genetic Association Database) GAD的的发展史展史 由美国国立由美国国立卫生研究院(生研究院(National Institutes of Health,NIH)开)开发和和维护 可以通可以通过http:/geneticassociationdb.nih.gov/ 访问该数据数据库n n数据数据库中的信息来源于中
21、的信息来源于对目前已有的关目前已有的关联分析分析结果的搜集和整理果的搜集和整理n n数据数据库中的中的信息是以基因信息是以基因为核心的核心的n n允允许所有用所有用户查看和提交看和提交记录n n截止到目前,数据截止到目前,数据库中的中的记录数已数已经达到了达到了39930条条,涉及到了,涉及到了2673个基因,个基因,5636种疾病种疾病表型,表型,555种影响疾病的种影响疾病的环境因素境因素 GAD数据数据库主要提供三部分功能:主要提供三部分功能: 数据数据视图部分部分,数据数据查询部分部分,数据数据资源部分源部分。 用用户可以在可以在线查询某种特定某种特定遗传病相关的基因病相关的基因或某个
22、或某个兴趣基因相关的疾病的信息,也可以在趣基因相关的疾病的信息,也可以在免免费注册注册账户后后对整个数据整个数据库中的数据中的数据进行下行下载。GAD的使用方法的使用方法 用用用用户户可以可以可以可以选择选择不同的角度不同的角度不同的角度不同的角度,包括疾病角度、基因角,包括疾病角度、基因角,包括疾病角度、基因角,包括疾病角度、基因角度、度、度、度、染色体角度染色体角度染色体角度染色体角度以及以及以及以及通通通通过过参考文献、参考文献、参考文献、参考文献、环环境因素等方境因素等方境因素等方境因素等方面面面面对对数据表数据表数据表数据表进进行行行行查询查询。 也可以也可以也可以也可以选择选择“
23、“AllAll” ”同同同同时时从多个角度从多个角度从多个角度从多个角度对对数据数据数据数据库库中的相关中的相关中的相关中的相关信息信息信息信息进进行行行行查询查询。 用用用用户户可以可以可以可以选择选择“ “Simple SearchSimple Search” ”,利用关,利用关,利用关,利用关键键字字字字实现实现对对数据数据数据数据库库中相关中相关中相关中相关记录记录的的的的简单查询简单查询;还还可以可以可以可以选择选择“ “Advanced SearchAdvanced Search” ”增加增加增加增加查询查询限定条件限定条件限定条件限定条件进进行数据行数据行数据行数据记记录录的高的
24、高的高的高级级搜索搜索搜索搜索。GAD的使用方法的使用方法n nGADGAD支持支持支持支持对对大量基因的批量大量基因的批量大量基因的批量大量基因的批量查询查询。n n用用用用户户可以可以可以可以选择选择“ “Positive OnlyPositive Only” ”以以以以筛选筛选得到疾病与基得到疾病与基得到疾病与基得到疾病与基因因因因间间存在存在存在存在显显著关著关著关著关联联的的的的记录记录。n n用用用用户还户还可以通可以通可以通可以通过过“ “Add RecordAdd Record” ”页页面面面面实现实现向数据向数据向数据向数据库库中提交中提交中提交中提交记录记录;通;通;通;通
25、过过“ “DownloadDownload” ”页页面面面面实现对实现对数据数据数据数据库库中数据的下中数据的下中数据的下中数据的下载载。选择选择“Browser All”链接可以得到链接可以得到如下如下结果结果应用应用GAD研究复杂疾病的研究复杂疾病的实例实例 LiuLiu等人等人等人等人20092009年年年年发发表在表在表在表在BMC BioinformaticsBMC Bioinformatics杂杂志上的文章志上的文章志上的文章志上的文章The etiome: identification and clustering of human The etiome: identificat
26、ion and clustering of human disease etiological factorsdisease etiological factors中,作者中,作者中,作者中,作者为为了研究影响疾病了研究影响疾病了研究影响疾病了研究影响疾病的因素,从的因素,从的因素,从的因素,从GADGAD数据数据数据数据库库中中中中获获取了与取了与取了与取了与10341034种复种复种复种复杂杂疾病相关疾病相关疾病相关疾病相关的的的的11001100个基因的相关数据;个基因的相关数据;个基因的相关数据;个基因的相关数据; YangYang等人等人等人等人20082008年年年年发发表于表于表
27、于表于BMC BioinformaticsBMC Bioinformatics杂杂志上的文志上的文志上的文志上的文章章章章An integrated database-pipeline system for An integrated database-pipeline system for studying single nucleotide polymorphisms and studying single nucleotide polymorphisms and diseasesdiseases为为了得到一个可用于研究了得到一个可用于研究了得到一个可用于研究了得到一个可用于研究遗传变遗传
28、变异与疾病异与疾病异与疾病异与疾病间间关系关系关系关系的数据的数据的数据的数据库库,也从,也从,也从,也从GADGAD中提取了疾病相关信息中提取了疾病相关信息中提取了疾病相关信息中提取了疾病相关信息进进行数据整合。行数据整合。行数据整合。行数据整合。三、癌症基因数据库(CGAP) Cancer Genome Anatomy Project,癌基因癌基因组解剖解剖计划划是一是一项由美国癌症研究所由美国癌症研究所(National Cancer Institute,NCI)于)于1996年年发起并建立和主持的交叉学科起并建立和主持的交叉学科计划划 用用户可以通可以通过http:/cgap.nci.
29、nih.gov/进行行访问 CGAP的的创建目的及建目的及总体目体目标CGAP被分为五个互补的自主部分被分为五个互补的自主部分 人类肿瘤基因索引(人类肿瘤基因索引(The Human Tumor Gene IndexThe Human Tumor Gene Index,hTGIhTGI) 分子表达谱(分子表达谱(Molecular ProfilingMolecular Profiling,MPMP) 癌症染色体变异计划(癌症染色体变异计划(The Cancer Chromosome Aberration The Cancer Chromosome Aberration ProjectProje
30、ct,CCAPCCAP) 遗传注解索引(遗传注解索引(The Genetic Annotation IndexThe Genetic Annotation Index,GAIGAI) 小鼠肿瘤基因索引(小鼠肿瘤基因索引(The Mouse Tumor Gene IndexThe Mouse Tumor Gene Index,mTGImTGI)n n提供了七个相关模提供了七个相关模提供了七个相关模提供了七个相关模块块,包括基因(,包括基因(,包括基因(,包括基因(GenesGenes)、)、)、)、染染染染色体(色体(色体(色体(ChromosomesChromosomes)、)、)、)、组织组
31、织(TissuesTissues)、)、)、)、SAGESAGE精灵(精灵(精灵(精灵(SAGE GenieSAGE Genie)、通路)、通路)、通路)、通路(PathwaysPathways)、工具()、工具()、工具()、工具(ToolsTools)和)和)和)和RNARNA干干干干扰扰(RNAiRNAi),用以提供用以提供用以提供用以提供对对所有所有所有所有CGAPCGAP中包含的数据、中包含的数据、中包含的数据、中包含的数据、生物信息学分析工具以及生物学相关生物信息学分析工具以及生物学相关生物信息学分析工具以及生物学相关生物信息学分析工具以及生物学相关资资源的源的源的源的查询查询和和
32、和和获获取,借助于取,借助于取,借助于取,借助于这这些模些模些模些模块块,用,用,用,用户户可以可以可以可以实现实现生物学生物学生物学生物学问题问题的的的的计计算机模算机模算机模算机模拟拟,从而快速地,从而快速地,从而快速地,从而快速地获获得得得得问题问题的解决的解决的解决的解决方案。方案。方案。方案。下载页面图所示,下载页面图所示,其中其中包含了人和小鼠两个物种的基因注释、包含了人和小鼠两个物种的基因注释、基因表达以及相关的一些文库中的数据。基因表达以及相关的一些文库中的数据。四、四、WHO规范的疾病分类标准(规范的疾病分类标准(ICD) 国国国国际际疾病分疾病分疾病分疾病分类类,简简称称称
33、称ICDICD(International International Classification of DiseasesClassification of Diseases),是目前国),是目前国),是目前国),是目前国际际上共上共上共上共同使用的同使用的同使用的同使用的统统一的疾病分一的疾病分一的疾病分一的疾病分类类方法方法方法方法。 ICDICD的目的是的目的是的目的是的目的是对对不同国家或地区在不同不同国家或地区在不同不同国家或地区在不同不同国家或地区在不同时间时间收集收集收集收集到的死亡和疾病数据到的死亡和疾病数据到的死亡和疾病数据到的死亡和疾病数据进进行系行系行系行系统统地地地地
34、记录记录、分析、解、分析、解、分析、解、分析、解释释和比和比和比和比较较,其中包括,其中包括,其中包括,其中包括对对各人群各人群各人群各人群组组一般健康状况的一般健康状况的一般健康状况的一般健康状况的分析,疾病分析,疾病分析,疾病分析,疾病发发病和患病的病和患病的病和患病的病和患病的监测监测以及其有关的其他以及其有关的其他以及其有关的其他以及其有关的其他健康健康健康健康问题问题。ICD的主要内容及应用范围的主要内容及应用范围囊括了群体健康状况分析、疾病发病率及流行性监测等多方面内容。常被用于分类疾病及其他许多类型的生命活动相关的健康问题。该体系除了可以用于存储和获取有关临床、流行病等的诊断信息
35、外,还为疾病的发病率和死亡率统计提供了基础。ICD的发展史的发展史 国国国国际际死因列表死因列表死因列表死因列表(International List of Causes of (International List of Causes of Death)Death) ICD ICD在第六版中首次加入了在第六版中首次加入了在第六版中首次加入了在第六版中首次加入了发发病原因的信息,并于病原因的信息,并于病原因的信息,并于病原因的信息,并于19481948年被当年被当年被当年被当时刚刚时刚刚建立的世界建立的世界建立的世界建立的世界卫卫生生生生组织组织(WHOWHO)接)接)接)接管和管和管和管和发
36、发布布布布 ICD-10ICD-10的的的的书书名由名由名由名由过过去的国去的国去的国去的国际际疾病分疾病分疾病分疾病分类类改改改改变为变为国国国国际际疾病与相关健康疾病与相关健康疾病与相关健康疾病与相关健康问题统计问题统计分分分分类类,首次引用了字母首次引用了字母首次引用了字母首次引用了字母编编目目目目ICD-10共分三卷共分三卷 第一卷是疾病和有关健康第一卷是疾病和有关健康第一卷是疾病和有关健康第一卷是疾病和有关健康问题问题的国的国的国的国际统计际统计分分分分类类,主主主主要包括要包括要包括要包括ICD-10ICD-10全部全部全部全部3 3位数位数位数位数或或或或4 4位数位数位数位数编
37、码编码内容及其必要内容及其必要内容及其必要内容及其必要的注的注的注的注释释和和和和说说明;明;明;明; 第二卷是第二卷是第二卷是第二卷是ICD-10ICD-10指指指指导导手册,用于指手册,用于指手册,用于指手册,用于指导导用用用用户户如何正确如何正确如何正确如何正确使用使用使用使用ICD-10ICD-10的第一卷和第三卷,并的第一卷和第三卷,并的第一卷和第三卷,并的第一卷和第三卷,并对对使用中需要遵使用中需要遵使用中需要遵使用中需要遵循的各循的各循的各循的各项规则项规则和有关和有关和有关和有关问题给问题给予予予予详细详细的介的介的介的介绍绍; 第三卷是第三卷是第三卷是第三卷是ICD-10IC
38、D-10字母索引,主要包括在字母索引,主要包括在字母索引,主要包括在字母索引,主要包括在查查找疾病、找疾病、找疾病、找疾病、损伤损伤、中毒的、中毒的、中毒的、中毒的临临床表床表床表床表现现和外部原因是和外部原因是和外部原因是和外部原因是详细详细的内容和的内容和的内容和的内容和编码编码。ICD的分类及编码原则的分类及编码原则 强调“以病因以病因为主、解剖部位和其他主、解剖部位和其他为辅”的原的原则采用采用3位或位或4位数的位数的“字母数字字母数字编码”形式,即形式,即第第1位位为英文字母,第英文字母,第2至至4位位为阿拉伯数字,阿拉伯数字,从从“A00-Z99”对所有的疾病所有的疾病归成成21大
39、大类疾病,疾病,再逐再逐渐细分成小分成小类等等详细内容。内容。 ICD-10在在编码使用上只使用上只对前前4位数有位数有统一要求,一要求,对以后的以后的扩展位数及展位数及编码排列没有限制排列没有限制ICD-10编码查询编码查询 (国际疾病分类编码)国际疾病分类编码)五、Disease Ontologyn n2003年在年在Northwestern大学启大学启动的的Nugene计划的一部分划的一部分n n提供一个与人提供一个与人类疾病相关的整合的生物医疾病相关的整合的生物医学数据集的开源学数据集的开源Ontology体系体系n n促促进各种疾病及相关健康状况向特定医学各种疾病及相关健康状况向特定
40、医学代代码的映射的映射n n期望构建成一个具有正确的期望构建成一个具有正确的Ontology体系体系结构并且在构并且在语义上可上可计算的算的结构形式构形式DO的构成 DO是将不同数据是将不同数据库通通过疾病概念整合到一起疾病概念整合到一起的开源的疾病体系:的开源的疾病体系: Medical Subject Headings(MeSH) Universal Medical Language System(UMLS)International Classification of Disease(ICD)Systematized Nomenclature of Human Veterinary Me
41、dicineClinical TermDO的历史 DODO发发展至今已有展至今已有展至今已有展至今已有3 3个版本:个版本:个版本:个版本: DO_V1DO_V1是基于是基于是基于是基于ICDICD编码编码的疾病体系的疾病体系的疾病体系的疾病体系 DO_V2DO_V2的体系主要基于的体系主要基于的体系主要基于的体系主要基于SNOMEDSNOMED,MeSHMeSH和和和和UMLSUMLS DO_V3 DO_V3在前一版本的基在前一版本的基在前一版本的基在前一版本的基础础上上上上进进行了修改,加入了更行了修改,加入了更行了修改,加入了更行了修改,加入了更多的多的多的多的临临床信息,如床信息,如床
42、信息,如床信息,如变变异位点、异位点、异位点、异位点、环环境、境、境、境、传传染源和染源和染源和染源和发发病病病病过过程等等程等等程等等程等等 DODO是开源的,网址是:是开源的,网址是:是开源的,网址是:是开源的,网址是:http:/ nHGMDn nGeneCardsn nTGDBn nBCGDn nHuGE Navigatorn nATLASGENETICSONCOLIGY HGMD HGMD由卡迪夫大由卡迪夫大由卡迪夫大由卡迪夫大学医学遗传研究所学医学遗传研究所学医学遗传研究所学医学遗传研究所开发和维护的,存开发和维护的,存开发和维护的,存开发和维护的,存储了大量的人类遗储了大量的人类
43、遗储了大量的人类遗储了大量的人类遗传病相关的基因突传病相关的基因突传病相关的基因突传病相关的基因突变数据变数据变数据变数据, ,只存储了与只存储了与只存储了与只存储了与人类遗传病相关的人类遗传病相关的人类遗传病相关的人类遗传病相关的核基因突变数据,核基因突变数据,核基因突变数据,核基因突变数据,并不包含体细胞突并不包含体细胞突并不包含体细胞突并不包含体细胞突变和线粒体基因突变和线粒体基因突变和线粒体基因突变和线粒体基因突变变变变 GeneCardsGeneCards由以色列由以色列WeizmannWeizmann科学研究所的科学研究所的CrownCrown人人类类基因基因组组中心开中心开发发和
44、和维护维护,整合了人,整合了人类类已已知及知及预测预测基因的基因基因的基因组组、蛋白蛋白质组质组、转录组转录组、遗传遗传以及功能等多方面信息的以及功能等多方面信息的综综合性数据合性数据库库, ,提供了更提供了更为为全面的功能基因全面的功能基因组组数据及数据及相关的其它数据相关的其它数据库库的外部的外部链链接可以接可以获获取疾病相关基取疾病相关基因的染色体定位、表达数因的染色体定位、表达数据、同源基因、据、同源基因、对应对应的蛋的蛋白白产产物等众多信息。物等众多信息。n nTGDB(The Tumor Gene Database)TGDB(The Tumor Gene Database)TGDB
45、(The Tumor Gene Database)TGDB(The Tumor Gene Database):癌症导致突变的基因、:癌症导致突变的基因、:癌症导致突变的基因、:癌症导致突变的基因、原癌基因、抑癌基因等相关信息的肿瘤基因数据库原癌基因、抑癌基因等相关信息的肿瘤基因数据库原癌基因、抑癌基因等相关信息的肿瘤基因数据库原癌基因、抑癌基因等相关信息的肿瘤基因数据库n nBCGD(The Breast Cancer Gene Database)BCGD(The Breast Cancer Gene Database)BCGD(The Breast Cancer Gene Database)
46、BCGD(The Breast Cancer Gene Database):存储乳腺癌:存储乳腺癌:存储乳腺癌:存储乳腺癌相关基因信息的乳腺癌基因数据库相关基因信息的乳腺癌基因数据库相关基因信息的乳腺癌基因数据库相关基因信息的乳腺癌基因数据库n nHuGE Navigator(The Human Genome Epidemiology HuGE Navigator(The Human Genome Epidemiology HuGE Navigator(The Human Genome Epidemiology HuGE Navigator(The Human Genome Epidemiol
47、ogy Navigator)Navigator)Navigator)Navigator):群体发病率、基因与疾病的关联关系、基因:群体发病率、基因与疾病的关联关系、基因:群体发病率、基因与疾病的关联关系、基因:群体发病率、基因与疾病的关联关系、基因与基因及基因与环境间互作等信息的人类基因组流行病学与基因及基因与环境间互作等信息的人类基因组流行病学与基因及基因与环境间互作等信息的人类基因组流行病学与基因及基因与环境间互作等信息的人类基因组流行病学导航导航导航导航n nATLASGENETICSONCOLIGY(ATLAS of Genetics and ATLASGENETICSONCOLIGY
48、(ATLAS of Genetics and ATLASGENETICSONCOLIGY(ATLAS of Genetics and ATLASGENETICSONCOLIGY(ATLAS of Genetics and Cytogenetics in Oncology and Haematology)Cytogenetics in Oncology and Haematology)Cytogenetics in Oncology and Haematology)Cytogenetics in Oncology and Haematology):肿瘤及:肿瘤及:肿瘤及:肿瘤及血液病相关的遗传学
49、和细胞遗传学数据库血液病相关的遗传学和细胞遗传学数据库血液病相关的遗传学和细胞遗传学数据库血液病相关的遗传学和细胞遗传学数据库第四节第四节疾病网络重构的计疾病网络重构的计算系统生物学方法算系统生物学方法计算系统生物学计算系统生物学计算系算系统生物学生物学(Computational systems biology)是系是系统生物学在运算法生物学在运算法则和和应用程序方面的用程序方面的发展,展,和生物信息学及和生物信息学及计算生物学算生物学紧密相密相连。计算系算系统生物学旨在开生物学旨在开发和运用更有效的算和运用更有效的算法、数据法、数据结构和通构和通讯工具,以工具,以进一步整合一步整合海量生物
50、数据,使生物学模式化海量生物数据,使生物学模式化工作流程工作流程n对选定的某一生物系定的某一生物系统的所有的所有组分分进行了解和确定,描行了解和确定,描绘出出该系系统的的结构,以此构造出一个初步的系构,以此构造出一个初步的系统模型;模型;n系系统地改地改变被研究被研究对象的内部象的内部组成成分或外部生成成分或外部生长条件,条件,然后然后观测在在这些情况下系些情况下系统组分或分或结构构发生的相生的相应变化化并把得到的有关信息并把得到的有关信息进行整合;行整合;n把通把通过实验得到的数据与根据模型得到的数据与根据模型预测的情况的情况进行比行比较,并并对初始模型初始模型进行修行修订;n根据修正后的模
51、型的根据修正后的模型的预测或假或假设,设定和定和实施新的改施新的改变系系统状状态的的实验,重复第二步和第三步,不断地通,重复第二步和第三步,不断地通过实验数据数据对模型模型进行修行修订和精和精练,得到一个理想的模型,得到一个理想的模型,使其理使其理论预测能能够反映出生物系反映出生物系统的真的真实性。性。Disease-Gene网络重构分析网络重构分析n n基因和疾病之基因和疾病之基因和疾病之基因和疾病之间间存在复存在复存在复存在复杂杂的多向的多向的多向的多向对应对应关系来源:关系来源:关系来源:关系来源:通通通通过过文献文献文献文献获获得的得的得的得的 根据关根据关根据关根据关联联分析的分析的
52、分析的分析的结结果推果推果推果推测测的的的的 通通通通过过生物学生物学生物学生物学实验证实实验证实的的的的n nOMIMOMIM、GADGAD和和和和CGAPCGAP等数据等数据等数据等数据库库提供了重要的提供了重要的提供了重要的提供了重要的资资源和源和源和源和线线索,可以索,可以索,可以索,可以获获得与某一种疾病有关的多个基得与某一种疾病有关的多个基得与某一种疾病有关的多个基得与某一种疾病有关的多个基因,同因,同因,同因,同时时也可以得到某一个基因参与的多个疾病也可以得到某一个基因参与的多个疾病也可以得到某一个基因参与的多个疾病也可以得到某一个基因参与的多个疾病The Human Disea
53、se Network DNA微微阵列技列技术应用于疾病研究中,通用于疾病研究中,通过检测大量的疾病表大量的疾病表达达谱,获得了大量的疾病相关基因的信息开得了大量的疾病相关基因的信息开发了了许多基于基因多基于基因表达表达谱的疾病基因的疾病基因识别方法方法Xuebing Wu的CIPHER算法Disease-Pathway网络重构分析n n代代代代谢谢系系系系统统疾病是一疾病是一疾病是一疾病是一类类特殊的疾病,主要是由参与各特殊的疾病,主要是由参与各特殊的疾病,主要是由参与各特殊的疾病,主要是由参与各种代种代种代种代谢谢通路的通路的通路的通路的酶酶或或或或编码酶编码酶的基因异常的基因异常的基因异常
54、的基因异常导导致的致的致的致的n nLee, D. S.Lee, D. S.等人根据基因在同一代等人根据基因在同一代等人根据基因在同一代等人根据基因在同一代谢谢通路中的通路中的通路中的通路中的邻邻近近近近关系重新构造了人关系重新构造了人关系重新构造了人关系重新构造了人类类代代代代谢谢代代代代谢谢相关疾病网相关疾病网相关疾病网相关疾病网络络,研究,研究,研究,研究了网了网了网了网络络中聚集成中聚集成中聚集成中聚集成团团的疾病在流行性、致死性以及的疾病在流行性、致死性以及的疾病在流行性、致死性以及的疾病在流行性、致死性以及发发生率等方面的特点生率等方面的特点生率等方面的特点生率等方面的特点n n内
55、分泌系内分泌系内分泌系内分泌系统统疾病、神疾病、神疾病、神疾病、神经经系系系系统统疾病等也可以采取疾病等也可以采取疾病等也可以采取疾病等也可以采取这这一一一一策略,有助于策略,有助于策略,有助于策略,有助于对对疾病的疾病的疾病的疾病的认识认识的不断深入和系的不断深入和系的不断深入和系的不断深入和系统统化化化化The implications of human metabolic network topology for disease co-morbidityDisease-microRNA网络重构分析网络重构分析n nmiRNAmiRNA和疾病关系的研究开始于和疾病关系的研究开始于和疾病关系
56、的研究开始于和疾病关系的研究开始于肿肿瘤,参与瘤,参与瘤,参与瘤,参与细细胞的增殖、胞的增殖、胞的增殖、胞的增殖、分化,在分化,在分化,在分化,在肿肿瘤形成早期也有重要的作用。利用瘤形成早期也有重要的作用。利用瘤形成早期也有重要的作用。利用瘤形成早期也有重要的作用。利用miRNAmiRNA表表表表达达达达谱谱可以比基因表达可以比基因表达可以比基因表达可以比基因表达谱谱更好区分更好区分更好区分更好区分肿肿瘤瘤瘤瘤类类型和型和型和型和亚亚型。型。型。型。miRNAmiRNA的表达的表达的表达的表达变变化成重要的分子化成重要的分子化成重要的分子化成重要的分子标记标记用来用来用来用来识别识别癌前和癌癌
57、前和癌癌前和癌癌前和癌的早期形成。的早期形成。的早期形成。的早期形成。n nmiRNAmiRNA在心在心在心在心脑脑血管疾病、神血管疾病、神血管疾病、神血管疾病、神经经系系系系统统疾病、免疫系疾病、免疫系疾病、免疫系疾病、免疫系统统疾病疾病疾病疾病等众多复等众多复等众多复等众多复杂杂疾病中的作用也逐疾病中的作用也逐疾病中的作用也逐疾病中的作用也逐渐渐被科学研究揭示。被科学研究揭示。被科学研究揭示。被科学研究揭示。n nHHMDHHMD、miR2DiseasemiR2Disease等数据等数据等数据等数据库库存存存存储储了了了了miRNAmiRNA和复和复和复和复杂杂疾疾疾疾病的信息,但是信息量
58、相病的信息,但是信息量相病的信息,但是信息量相病的信息,但是信息量相对较对较少,研究偏好和数据少,研究偏好和数据少,研究偏好和数据少,研究偏好和数据资资料的料的料的料的不足将不足将不足将不足将显显著地影响研究著地影响研究著地影响研究著地影响研究结结果。基于网果。基于网果。基于网果。基于网络络方法的研究方法的研究方法的研究方法的研究还还主要主要主要主要致力于研究致力于研究致力于研究致力于研究单单一疾病或某一疾病或某一疾病或某一疾病或某类类疾病疾病疾病疾病过过程中的程中的程中的程中的miRNAmiRNA调调控关控关控关控关系系系系双向网络图显示失调miRNA与各种癌症之间的关系其他类型网络重构分析
59、n n复复复复杂杂疾病的分子疾病的分子疾病的分子疾病的分子过过程中,除了有基因、程中,除了有基因、程中,除了有基因、程中,除了有基因、miRNAmiRNA转转录录因子等,因子等,因子等,因子等,SNPSNP、蛋白、蛋白、蛋白、蛋白质质、代、代、代、代谢谢和信号和信号和信号和信号转导过转导过程程程程中的小分子等也在疾病中的小分子等也在疾病中的小分子等也在疾病中的小分子等也在疾病过过程中程中程中程中发挥发挥重要的作用。重要的作用。重要的作用。重要的作用。n n各个各个各个各个层层面的生物学数据和知面的生物学数据和知面的生物学数据和知面的生物学数据和知识识,如基因表达,如基因表达,如基因表达,如基因
60、表达谱谱功功功功能注能注能注能注释释、蛋白、蛋白、蛋白、蛋白质质互作、代互作、代互作、代互作、代谢组谢组学等信息也在复学等信息也在复学等信息也在复学等信息也在复杂杂疾病研究中得到了疾病研究中得到了疾病研究中得到了疾病研究中得到了应应用。用。用。用。Jiguang Wang等结合OMIM 和GenAge数据库,将疾病和衰老通过关联的基因映射到蛋白质互作网络HPRD上,构建了疾病-衰老网络DANGuanghui Hu等人利用从GEO数据库中获得的疾病和药物相关的基因表达谱构建了疾病-药物网络小结n n介介绍了疾病的概念、特点、影响因素和分了疾病的概念、特点、影响因素和分类方法方法n n重点介重点介
61、绍了了OMIM、GAD、CGAP等重要疾等重要疾病数据病数据库存存储的主要信息和基本使用方法的主要信息和基本使用方法n n简要介要介绍了了ICD和和DO两个疾病分两个疾病分类体系体系n n展望了展望了计算系算系统生物学方法在复生物学方法在复杂疾病研疾病研究究过程中的程中的应用,并用,并结合科研合科研实例探例探讨了了疾病疾病-基因网基因网络、疾病、疾病-通路网通路网络、疾病、疾病-miRNA网网络等前沿等前沿进展展课后习题n n简述孟德述孟德尔遗传疾病的定疾病的定义和复和复杂疾病的疾病的定定义,以及两者的区,以及两者的区别和和联系。系。n n举例例说明疾病,尤其是复明疾病,尤其是复杂疾病是多基因疾病是多基因基因和基因和环境互作的境互作的结果。果。n n试从分子从分子层面分析,疾病面分析,疾病产生的原因。生的原因。n n浅浅谈你你对“生物体是一个复生物体是一个复杂的网的网络”这句句话的的认识。n n常用的复常用的复杂疾病数据疾病数据库有哪些?有哪些?简述其异述其异同。同。n n简述你所了解的疾病分述你所了解的疾病分类体系,体系,说明其分明其分类依据及原依据及原则。n n谈谈你你对计算系算系统生物学方法的生物学方法的认识,试设计一个可以一个可以应用系用系统生物学方法解决的生物学方法解决的课题。