肿瘤研究的分子生物学数据库资源

上传人:汽*** 文档编号:569986471 上传时间:2024-08-01 格式:PPT 页数:94 大小:6.02MB
返回 下载 相关 举报
肿瘤研究的分子生物学数据库资源_第1页
第1页 / 共94页
肿瘤研究的分子生物学数据库资源_第2页
第2页 / 共94页
肿瘤研究的分子生物学数据库资源_第3页
第3页 / 共94页
肿瘤研究的分子生物学数据库资源_第4页
第4页 / 共94页
肿瘤研究的分子生物学数据库资源_第5页
第5页 / 共94页
点击查看更多>>
资源描述

《肿瘤研究的分子生物学数据库资源》由会员分享,可在线阅读,更多相关《肿瘤研究的分子生物学数据库资源(94页珍藏版)》请在金锄头文库上搜索。

1、肿瘤研究的分子生物学数据库肿瘤研究的分子生物学数据库资源资源一篇论文的题目一篇论文的题目lZhu F, Zykova TA, Kang BS, Wang Z, Ebeling MC, Abe Y, Ma WY, Bode AM, Dong Z. lBidirectional signals transduced by TOPK-ERK interaction increase tumorigenesis of HCT116 colorectal cancer cells.lGastroenterology. 2007; 133(1):219-31.主主 要要 内内 容容lNCBI的相关数据库资

2、源的相关数据库资源l肿瘤学和血液学的细胞遗传学肿瘤学和血液学的细胞遗传学lExPASy的数据库资源和工具的数据库资源和工具NCBI的相关资源的相关资源lNational Center for Biotechnology Informationlhttp:/Genes and diseasel单基因遗传病的站点介绍多个系统的遗传病,可下载PDF文件。图示遗传病相关基因在染色体的定位与相关数据库相互链接Genes and disease Genes and disease 页面页面页面页面染色体的图谱染色体的图谱lSKYSpectral Karyotyping多色标记的探针与染色体杂交 lM-FI

3、SHMultiplex Fluorescence In Situ Hybridization lCGHComparative Genomic Hybridization肿瘤和对照细胞的基因组DNA标记不同颜色荧光探针等量混合后分别与肿瘤和对照细胞的染色体杂交。 SKY的的原理原理CGH的的原理原理lCGH比较工具输入染色体片段和得失,如:7gain或3ploss. 比较工具比较工具比较结果比较结果CGH图示图示l大规模分析基因表达的方法对某一组mRNA中基因表达定量检测 一群mRNA中的每一个mRNA的同一位置取9-10bp的一段序列,(从统计学上说这样的序列可以代表95%的人类基因),每一种

4、9-10bp的序列的拷贝数则代表基因表达的拷贝数,也就可以说明基因表达活性的高低。l方法方法RNA反转录为反转录为cDNA,同时用生物素标记,同时用生物素标记cDNA末端末端随后用一种限制性内切酶(随后用一种限制性内切酶(NlaIII (CATG))切割)切割cDNA分离酶切位点分离酶切位点3端的序列端的序列另一种酶再切割另一种酶再切割cDNA片段,去除带生物素的片段,去除带生物素的3端端用用PCR扩增每一个标签片段,将扩增每一个标签片段,将30-50个不同的标签片个不同的标签片段连成一个单一的段连成一个单一的DNA分子分子最后克隆并测序这些分子最后克隆并测序这些分子酶切位点酶切位点3端的序列

5、出现的拷贝数就代表了基因表达活端的序列出现的拷贝数就代表了基因表达活性的高低性的高低 流程图流程图选择细胞磁珠分离RNA并合成cDNA锚定内切酶(NlaIII)酶切NlaIII3端序列为标签,再用BsmF1酶切后释放标签将标签相互连接并连入质粒载体测序并计算标签的拷贝数计算机分析l查询方式.by tag.by sequence.by library.by gene namel输入序列l先查询序列中的Tagl根据Tag来查询在SAGE文库中出现的频率输入输入GenBank号或序列进行查询号或序列进行查询查询结果查询结果查询结果Cancer Genome Anatomy Project (http

6、:/)l由National Cancer Institute(NCI)管理 l目的是研究肿瘤细胞的分子改变CGAP主页主页Genesl每个基因一个Gene info页面UniGene、LocusLink、OMIM、DTP search、cDNA Libraries、Cluster Assemblies、和SNPs等数据库的链接 细胞遗传学定位和Mitelman断裂点信息 蛋白相似性人类和小鼠的同源组IMAGE(Integrated Molecular Analysis of Genomes and their Expression)协议来源的序列链接全长MGC(Mammalian Gene C

7、ollection)克隆链接Gene Ontology功能分类 lGenes工具列表 Gene finder:按照特定标准查找单个或多个基因的工具Gene Ontology Browser:通过分子功能、生物学过程和细胞组分对人和小鼠的基因分类Nucleotide BLAST:通过CGAP界面,查找给定核苷酸序列的代表基因Lists of Candidate, Validated, and Confirmed SNPs:包含单核苷酸多态性的基因信息CGAP SNP Index:通过基因名称、符号和GenBank序列号查找代表SNPsSNP Gene Viewer:将人类SNPs定位于参考序列和

8、MGC序列,预测蛋白编码的变化 Gene infoChromosomes lMitelman Database of Chromosome Aberrations in Cancer (肿瘤染色体畸变数据库)Recurrent Chromosome Aberrations Searcher用来查找重复出现的染色体畸变 lSNP500 Cancer Database用于查找SNP的工具可以通过基因名称、SNP号、染色体和基因功能查询查找肿瘤重复出现的染色体畸变查找肿瘤重复出现的染色体畸变Tissues l来源于组织的基因表达信息 Library Finder工具可以帮助查找组织特异性的文库。Ge

9、ne Library Summarizer(GLS):在特定的cDNA文库中查找所有基因。cDNA xProfiler:用于在两个cDNA文库之间比较基因表达。Differential Gene Expression Displayer(DGED):用于在两个cDNA文库之间比较基因表达的统计学差异。 SAGEmap xProfiler:xProfiler程序比较一个cDNA在不同cDNA文库中的表达情况。SAGEmap Virtual Northern:以图形形式显示一个基因在不同cDNA文库中出现的频率,代表其表达丰度。 cDNA xProfiler SAGESAGE Anatomic V

10、iewer查询结果查询结果Tissue only 查询结果查询结果SAGE的数据的数据RNAiPATHWAYSlBioCarta公司信号转导途径图谱 lKEGG代谢途径和信号转导途径图谱 lPathway SearcherlCGAP基因表达分析工具的汇总 Tools肿瘤学和血液学的细胞遗传学肿瘤学和血液学的细胞遗传学http:/http:/l收集了各种在肿瘤中具有染色体异常的基因,包括其基因名称、产物、在肿瘤中的异常情况,以及与各种数据库的链接l收集了白血病、实体瘤、癌前病变的细胞遗传学数据l以染色体来分类描述各种肿瘤中的染色体异常l包括了许多高水平的综述(Deep Insight)和病例报告

11、22号染色体号染色体t(9;22)(q34;q11)t(2;8)(p12;q24)t(8;22)(q24;q11)IGKChr 2IGLChr 22t(8;14)(q24;q32)MYCChr 8IGHChr 14Burkitt LymphomaPromoterCoding sequencesPromoterCoding sequencesPromoterCoding sequencesDeregulated geneConsequences of Balanced Chromosome RearrangementsIGH, IGK, IGL MYC Deregulated transcrip

12、tionETV6/NTRK346 Fusion Genes in Benign and Malignant Soft Tissue Tumors 1992 1993 1994 1995 1996 1997 1998 1999EWSR1/ATF1FUS/DDIT3 PAX3/FOXO1AEWSR1/ERG EWSR1/WT1PAX7/FOXO1ASS18/SSX2EWSR1/NR4A3HMGA2/LPPSS18/SSX1EWSR1/DDIT3EWSR1/ETV4COL1A1/PDGFBEWSR1/FEVEWSR1/FLI1 2000 2001 2002 2003 2004 2005 2006 2

13、007HMGA2/LHFPSS18/SSX4 TAF15/NR4A3COL1A2/PLAG1EWSR1/ZNF278 FUS/ATF1HAS2/PLAG1TCF12/NR4A3TPM3/ALKTPM4/ALKASPSCR1/TFE3CLTC/ALKLPP/C12ORF9CARS/ALKHMGA2/CMKOR1ATIC/ALK FUS/CREB3L2FUS/ERGRANBP2/ALKSS18L1/SSX1ACTB/GLITGF/NR4A3PAX3/NCOA1FUS/CREB3L1CIC/DUX4COL6A3/CSF1EWSR1/CREB1HMGA2/EBFSEC31A/ALKEWSR1/SP31

14、9921993199419951997199820002001200320042006Ewing tumorAlveolar RMS, Clear cell sarcoma of soft tissue, Myxoid liposarcoma Desmoplastic small round cell tumor, Synovial sarcomaExtraskeletal myxoid chondrosarcoma, Lipoma Dermatofibrosarcoma protuberansInfantile fibrosarcomaAFH, Lipoblastoma, Inflammat

15、ory myofibroblastic tumorAlveolar soft part sarcomaLow grade fibromyxoid sarcoma, Soft tissue chondromaPericytomaTenosynovial giant cell tumorSoft Tissue Tumors with Specific Gene FusionsFrequencies of fusion genes in AMLt(8;21)(q22;q22)RUNX1/RUNX1T14.3%t(15:17)(q22;q21)PML/RARA4.1%der(11)(q23)MLL r

16、earrangement2.4%inv(16)(p13q22)CBFB/MYH112.3%t(9;22)(q34;q11)BCR/ABL10.7%inv(3)(q21q26)RPN1/EVI10.6%t(6;9)(p22;q34)DEK/NUP2140.3%t(1;22)(p13;q13)RBM15/MKL10.2%t(8;16)(p11;p13)MYST3/CREBBP0.1%t(7;11)(p15;p15)NUP98/HOXA genes Protein从从DNA序列翻译成蛋白序列序列翻译成蛋白序列从蛋白质序列翻译成核酸序列从蛋白质序列翻译成核酸序列蛋白序列与基因组序列比较内含子和读框的蛋

17、白序列与基因组序列比较内含子和读框的错误错误lSimilarity searches序列相似性比较工具序列相似性比较工具主要有主要有BLAST和和FASTAlPattern and profile searches查找蛋白序列中基序、结构域等的工具查找蛋白序列中基序、结构域等的工具主要查找主要查找Prosite和和Pfam数据库数据库多种查找工具多种查找工具lPost-translational modification prediction翻译后修饰的预测工具翻译后修饰的预测工具预测蛋白质糖基化、线粒体锚定位点、信号预测蛋白质糖基化、线粒体锚定位点、信号肽切割位点、磷酸化位点等肽切割位点、磷

18、酸化位点等Dif14蛋白的蛋白的prosite分析(分析(ScanProsite)lTopology prediction蛋白质定位预测工具蛋白质定位预测工具包括了预测蛋白质的定位(细胞膜、浆、核包括了预测蛋白质的定位(细胞膜、浆、核等)等)跨膜区预测跨膜区预测Dif14蛋白的跨膜区预测(蛋白的跨膜区预测(SOSUI)跨膜螺旋的组成跨膜螺旋的组成预测的跨膜结构预测的跨膜结构Dif14蛋白的跨膜区预测(蛋白的跨膜区预测(TMpred)lPrimary structure analysis预测蛋白质的物理化学参数:如氨基酸组成、预测蛋白质的物理化学参数:如氨基酸组成、等电点、分子量等等电点、分子量

19、等Paircoil:预测螺旋区结构:预测螺旋区结构PESTfind:蛋白质的半衰期预测,富于:蛋白质的半衰期预测,富于 Proline (P), glutamic acid (E), serine (S) and threonine (T) 的蛋白容易降解(的蛋白容易降解(PESTfind)HLA_Bind:预测:预测MHC I分子的多肽结合位点分子的多肽结合位点SYFPEITHI:预测:预测MHC I和和II类分子的多肽结类分子的多肽结合位点合位点Protein Colourer:将蛋白的氨基酸加成各种颜:将蛋白的氨基酸加成各种颜色色 Protein ColourerProtScale:氨基

20、酸亲水性、构象分析RandSeq:随机蛋白序列的产生lSecondary structure prediction蛋白的二级结构预测蛋白的二级结构预测多种工具多种工具lAGADIRlBCM PSSPlProflGOR IVlHNNlJpredlnnPredictlnnpredictGOR4分析结果分析结果lTertiary structure蛋白质三级结构预测蛋白质三级结构预测包含了多种工具包含了多种工具都是基于已知的蛋白质结构的基础上都是基于已知的蛋白质结构的基础上先将输入序列与蛋白数据库同源性比较,如先将输入序列与蛋白数据库同源性比较,如果有已知结构的蛋白高度同源则根据该蛋白果有已知结构的

21、蛋白高度同源则根据该蛋白的结构进行预测。的结构进行预测。lSequence alignment序列排列序列排列提供多种工具提供多种工具不同工具根据不同算法不同工具根据不同算法应用目的就是发现蛋白之间的保守区应用目的就是发现蛋白之间的保守区ClustalW:输入多个序列时的格式是FASTA格式。举例:基因名称MAQYALEAGVSWLA(序列)基因名称MEGQDEVSAREQHFHClustalw的分析结果的分析结果Clustalw排列的结果排列的结果lBiological text analysis从文献中提取信息的一些工具从文献中提取信息的一些工具MedMiner:从从Medline中根据基因名称提取中根据基因名称提取其功能注解的词或句其功能注解的词或句

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号