实验三: 核酸序列分析

上传人:cn****1 文档编号:473326074 上传时间:2023-01-17 格式:DOCX 页数:3 大小:13.87KB
返回 下载 相关 举报
实验三: 核酸序列分析_第1页
第1页 / 共3页
实验三: 核酸序列分析_第2页
第2页 / 共3页
实验三: 核酸序列分析_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《实验三: 核酸序列分析》由会员分享,可在线阅读,更多相关《实验三: 核酸序列分析(3页珍藏版)》请在金锄头文库上搜索。

1、核酸序列分析【实验目的】2、掌握使用BioEdit软件进行核酸序列的基本分析;3、熟悉基于核酸序列比对分析的真核基因结构分析(内含子/外显子分析);【实验原理】 针对核酸序列的分析就是在核酸序列中寻找基因,找出基因的位置和功能位点的 位置,以及标记已知的序列模式等过程。在此过程中,确认一段 DNA 序列是一 个基因需要有多个证据的支持。一般而言,在重复片段频繁出现的区域里,基因 编码区和调控区不太可能出现;如果某段 DNA 片段的假想产物与某个已知的蛋 白质或其它基因的产物具有较高序列相似性的话,那么这个 DNA 片段就非常可 能属于外显子片段;在一段DNA序列上出现统计上的规律性,即所谓的密

2、码子 偏好性,也是说明这段 DNA 是蛋白质编码区的有力证据;其它的证据包括与 模板序列的模式相匹配、简单序列模式如TATA Box等相匹配等。一般而言,确 定基因的位置和结构需要多个方法综合运用,而且需要遵循一定的规则:对于真 核生物序列,在进行预测之前先要进行重复序列分析,把重复序列标记出来并除 去;选用预测程序时要注意程序的物种特异性;1. 重复序列分析 对于真核生物的核酸序列而言,在进行基因辨识之前都应该把简单的大量的重复 序列标记出来并除去,因为很多情况下重复序列会对预测程序产生很大的扰乱, 尤其是涉及数据库搜索的程序。链接:http:/www.repeatmasker.org/cg

3、i-bin/WEBRepeatMasker/2. 数据库搜索 把未知核酸序列作为查询序列,在数据库里搜索与之相似的已有序列是序列分析 预测的有效手段。在理论课中已经专门介绍了序列比对和搜索的原理和技术。但 值得注意的是,由相似性分析作出的结论可能导致错误的流传;有一定比例的序 列很难在数据库里找到合适的同源伙伴。对于 EST 序列而言,序列搜索将是非 常有效的预测手段。链接:http:/blast.ncbi.nlm.nih.gov/Blast.cgi3. 编码区统计特性分析统计获得的经验说明, DNA 中密码子的使用频率不是平均分布的,某些密码子 会以较高的频率使用而另一些则较少出现。这样就使

4、得编码区的序列呈现出可察 觉的统计特异性,即所谓的密码子偏好性。利用这一特性对未知序列进行统计 学分析可以发现编码区的粗略位置。这一类技术包括:双密码子计数 (统计连续 两个密码子的出现频率);核苷酸周期性分析(分析同一个核苷酸在 3,6,9,. . .位置 上周期性出现的规律);均一/复杂性分析(长同聚物的统计计数);开放可读框架 分析等。程序: BioEdit4. 启动子分析 启动子是基因表达所必需的重要序列信号,识别出启动子对于基因辨识十分重 要。有一些程序根据实验获得的转录因子结合特性来描述启动子的序列特征,并 依次作为启动子预测的依据,但实际的效果并不十分理想,遗漏和假阳性都比较 严

5、重。总的来说,启动子仍是值得继续研究探索的难题。链接:http:/www-bimas.cit.nih.gov/molbio/proscan/5. 内含子 / 外显子剪接位点 剪接位点一般具有较明显的序列特征,但是要注意可变剪接的问题。由于可变剪 接在数据库里的注释非常不完整,因此很难评估剪接位点识别程序预测剪接位点 的敏感性和精度。如果把剪接位点和两侧的编码特性结合起来分析则有助于提供 剪接位点的识别效果。链接:http:/www.fruitfly.org/seq tools/splice.html6. 翻译起始位点 对于真核生物,如果已知转录起始点,并且没有内含子打断 5非翻译区的话, Ko

6、zak规则可以在大多数情况下定位起始密码子。原核生物一般没有剪接过程, 但在开放阅读框中找正确的起始密码子仍很困难。这时由于多顺反操纵子的存 在,启动子定位不象在真核生物中起关键作用。对于原核生物,关键是核糖体结 合点的定位,可以由多个程序提供解决方案。链接:http:genes.mit.edu/GENSCAN.html7. 翻译终止信号PolyA 和翻译终止信号不象起始信号那么重要,但也可以辅助划分基因的范围。8. 其它综合基因预测工具 除了上面提到的程序之外,还有许多用于基因预测的工具,它们大多把各个方面 的分析综合起来,对基因进行整体的分析和预测。多种信息的综合分析有助于提 高预测的可靠

7、性,但也有一些局限:物种适用范围的局限;对多基因或部分基因, 有的预测出的基因结构不可靠;预测的精度对许多新发现基因比较低;对序列中 的错误很敏感;对可变剪接、重叠基因和启动子等复杂基因语法效果不佳。链接:http:li nu roup=promoter【实验内容】1、使用Entrez或SRS信息查询系统检索人瘦素(leptin)的mRNA、基因组DNA、 外显子和 5调控区 (promoter) 等核酸序列,提取该序列内容,阅读序列格式的 解释,理解其含义;2、使用 BioEdit 软件对上述核酸序列进行分子质量、碱基组成、碱基分布、序列 变换以及限制性酶切分析等基本分析,并从BioEdi

8、t软件的help栏了解该软件 的其它功能;3、使用 BioEdit 软件对人瘦素 (leptin) 的 mRNA 序列进行可读框架分析;5、使用Blast2进行人瘦素(leptin)mRNA序列与其外显子或基因组序列的比对 分析。【实验方法】1 、 调 用 Internet 浏 览 器 , 并 在 其 地 址 栏 输 入 Entrez 网 址 : http:/www.ncbi.nlm.nih.gov/Entrez;2、在 Search 后的选择栏中选择 nucleotide;3、在输入栏输入 homo sapiens leptin;4、点击 go 后显示序列接受号及序列名称等;5、查找人 le

9、ptin (obesity homolog, mouse) mRNA 序列(提示:NM_000230), 点击序列接受号后显示序列详细信息;6、将序列转为FASTA格式保存7、根据从NM_000230 了解的基因定位信息查找人瘦素的基因组DNA (Contig) 的序列接受号及序列识别号,点击序列接受号显示序列详细信息;8、在输入栏输入 homo sapiens leptin exon 查找人瘦素外显子序列;9、在输入栏输入 homo sapiens leptin promoter 查找人瘦素 5调控区序列;10、按上述步骤用SRS信息查询系统检索人瘦素(leptin)的mRNA、基因组DNA

10、、外显子和5调控区(promoter)等核酸序列;11、将上述核酸序列输入BioEdit软件进行序列基本分析;12、打开 BioEdit 软件,点击help栏,阅读contents;13、将人瘦素(leptin)的mRNA序列输入BioEdit软件进行可读框架分析:打开 BioEdit软件一将人瘦素(leptin) mRNA的FASTA格式序列输入分析框一点击左 侧序列说明框中的序列说明f点击sequenee栏一选择nucleic acid一点击find next ORFf查看起始密码位置和编码区范围(57557);14、人瘦素 (leptin) mRNA 序列与其外显子或基因组序列的比对分析

11、:调用 Internet 浏 览 器 并 在 其 地 址 栏 输 入 Blast2 网 址 (http:/www.ncbi.nlm.nih.gov/Entrezgorf/bl2/html) 一将人瘦素 (leptin) mRNA 和外显子的FASTA格式序列分别输入sequence2和sequence1分析框或将人瘦 素(leptin) mRNA和基因组序列的GI版本号输入sequence2和sequence1的 GI 版本号框一点击 Align 后显示两序列比对的详细信息一查找 mRNA 序列上各 外显子的位置。【作业】1、归纳对人瘦素 (leptin) 的核酸序列分析的结果,列出主要的分析结果2、总结核酸序列分析的基本步骤,相互对比结果,指出应注意的事项。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号