mega软件的使用1.doc

上传人:F****n 文档编号:97901377 上传时间:2019-09-07 格式:DOC 页数:61 大小:5.64MB
返回 下载 相关 举报
mega软件的使用1.doc_第1页
第1页 / 共61页
mega软件的使用1.doc_第2页
第2页 / 共61页
mega软件的使用1.doc_第3页
第3页 / 共61页
mega软件的使用1.doc_第4页
第4页 / 共61页
mega软件的使用1.doc_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《mega软件的使用1.doc》由会员分享,可在线阅读,更多相关《mega软件的使用1.doc(61页珍藏版)》请在金锄头文库上搜索。

1、MEGA软件的使用Mega软件输入数据的格式Mega软件输入数据的格式比较简单,在众多遗传学分析软件中是比较容易制作的一种。首先,如果输入数据是一般的DNA或RNA序列,则有如下要求:1)文件扩展名以*.meg或*.txt结尾都行;2)输入数据文件,第一行必须有Mega程序所需的特殊标记“#MEGA”;3)“TITLE”位于输入文件的第二行,后边可以跟上一些说明性字符,这些字符在输出结果中会显示出来。在与“Title”同一行上的字符才有效,而且字符总数不能超过128,超过的也会被忽略。4)在“#MEGA”和“TITLE”之后,在分析数据之前可以一行或多行的说明性文字。这些文字可用来说明诸如作者

2、、分析日期、分析目的等信息。5)在每个数据(或每条序列)的名字之前应该有一个“#”,名字的下一行是具体的序列。在同一个数据文件里,不能出现数据名相同的序列。在数据名及具体序列中,空格和TAB是被忽略的。6)在同一数据文件内,所有序列的长度应该保持一致,否则,程序不能执行。 7)对于DNA或RNA序列,Mega软件能够识别A、T、C、G、U五种字符,缺失字符可以用“?”表示,比对时的空缺位点可以用“”表示。下边是一个数据文件示例:Fig其次,如果输入数据是遗传距离矩阵,则要求如下:1)前4点要求同对上述DNA序列的要求相同;2)在每个距离矩阵的名字之前应该有一个“#”,每个名字占一行;先列出距离

3、矩阵的名字,然后再给出距离矩阵;3)距离矩阵有两种形式,下三角和上三角。下边是一个数据文件示例:Fig下图是距离矩阵的示意图,左边是下三角矩阵,右边是上三角矩阵。Fig再次,如果数据是测序图谱的形式,直接导入即可。下图是测序图谱示例:FigMEGA界面及操作Mega是一款操作十分简便的遗传学分析软件,其界面十分友好,即使初学者也很易上手。1、数据的录入及编辑Mega软件能够接受多种数据格式,如FASTA格式、Phylip格式、PAUP数据格式等等。而且Mega软件专门提供了把其他格式的数据转换位Mega数据格式的程序。首先,打开Mega程序,有如下图所示的操作界面:Fig单击工具栏中的“Fil

4、e”按钮,会出现如下图所示的菜单:Fig从上图可以看出,下拉菜单有“Open Data”(打开数据)、“Reopen Data”(打开曾经打开的数据,一般会保留新近打开的几个数据)、“Close Data”(关闭数据)、“Export Data”(导出数据)、“Conver To MEGA Format”(将数据转化为MEGA格式)、“Text Editor”(数据文本编辑)、“Printer Setup”(启动打印)、“Exit”(退出MEGA程序)。单击“Open Data”选项,会弹出如下菜单:Fig浏览文件,选择要分析的数据打开,单击“打开”按钮,会弹出如下操作界面:Fig此程序操作界

5、面,提供了三种选择数据选择:Nucleotide Sequences(核苷酸序列)、Protein Sequences(蛋白质序列)、Pairwise Distance(遗传距离矩阵)。根据输入数据的类型,选择一种,点击“OK”即可。如果选择“Pairwise Distance”,则操作界面有所不同;如下图所示:Fig根据遗传距离矩阵的类型,如果是下三角矩阵,选择“Lower Left Matrix”即可;如果是上三角矩阵,选择“Upper Right Matrix”即可。点击“OK”按钮,即可导入数据。如果是核苷酸数据,则读完之后,会弹出如下对话框:Fig如上图,如果是编码蛋白质的核苷酸序列

6、,则选择“Yes”按钮;如果是不编码蛋白质的核苷酸序列,则点击“No”按钮。之后,会弹出如下操作窗口:Fig此作界面的名称是“Sequence Data Explorer”,在其最上方是工具栏“Data”、“Display”、“Highlight”等,然后是一些数据处理方式的快捷按钮,在操作界面的左下方是每个序列的名称。显示序列占了操作界面的绝大部分,与第一个序列相同的核苷酸用“.”表示,发生变异的序列则直接显示。如果在弹出的对话框中,点击“OK”,即选择输入的数据是编码蛋白质的DNA序列。那么会再弹出如下对话框:Fig此操作界面提供了多种生物的遗传密码方式的选择,如Vertebrate Mi

7、tochondrial(脊椎动物线粒体)、Invertebrate Mitochondrial(非脊椎动物线粒体)、Yeast Mitochondrial(酵母线粒体)等等。点击此操作界面的“Add”按钮,可以添加密码子表格,其编辑界面如下图所示:Fig通过此操作界面可以创建、修改密码子表格。点击“OK”按钮可以返回“Select Genetic Code”操作界面。点击“Select Genetic Code”操作界面的“Delect”按钮,可以删除一个密码子表。 点击“Select Genetic Code”操作界面的“Edit”按钮,可以对已经存在的密码子表格。其操作界面与“Geneti

8、c Code Table”相同。点击“Select Genetic Code”操作界面的“View”按钮,可以浏览选中的密码子表格。点击“Select Genetic Code”操作界面的“Statistics”按钮,可以统计密码子表格的一些信息,如每种密码子的频率、同义位点数、非同义位点数等。点击点击“Select Genetic Code”操作界面的“OK”按钮,会弹出如上图所示的“Sequence Data Explorer”操作界面。如果点击“Cancel”按钮,也会弹出此操作界面,但是此时会把数据默认为非编码的DNA序列。单击“Sequence Data Explorer”操作界面工

9、具栏的“Data”按钮,有如下图所示的下拉菜单:Fig下拉菜单有六个选项:“Write Data To File”(将数据转到文件中,利用此选项可以把Mega数据格式的数据转化成其它格式)、“Translate/Untranslate”(是否翻译,这个选项只有所分析的DNA序列是编码序列时才被激活)、“Selcet Genetic Code Table”(选择遗传密码表,这个选项只有所分析的DNA序列是编码序列时才被激活)、“Setup/Selcet Genes&Domains”(选择或设置基因或结构域)、“Setup/Select Taxa&Group”(对数据进行分组)、“Quit Dat

10、a Viewer”(退出此浏览框)。单击“Write Data To File”选项,会弹出如下对话框:FigTitle框显示的内容是数据文件中“TITLE”之后的内容。Description框显示的内容是数据文件中对整体数据描述的内容。Format选项提供一个下来菜单,通过此下拉菜单可以把数据转化为MEGA格式、Nexus(PAUP4.0)格式,PHYLIP3.0格式、Nexus(PAUP3.0/MacClade)格式。Writing site numbers 选项也提供一个下拉菜单,通过此下来菜单可以把给每个核苷酸标序号,“None”为不显示序号,“For each site”为每个位点显

11、示序号,“At the end of line”在每一行行末显示序号。 Missing Data and alignment gaps选项也提供了一个下拉式菜单,这个菜单包括:“Include sites with miss/ambiguous data gaps”(显示缺失位点及模糊位点以及空缺)、“Exclude sites with miss/ambiguous data gaps”(不显示缺失位点及模糊位点以及空缺)、“Exclude sites with miss/ambiguous data only” (仅不显示缺失位点及模糊位点)、“Exclude sites with ali

12、gnment gaps only”(仅不显示比对是的空缺部分)。如上述操作界面中的选项,点击“OK”按钮,会弹出如下界面:Fig此操作界面中的文字可以拷贝到文本文档中。如果在“Squence Data Explorer” 操作界面的工具栏中选择“Highlight”中的“Varible sites”选项,则单击“Write Data To File”选项,会弹出如下对话框:Fig我们会发现与上述“Exporting Sequence Data”操作界面相比,在最下方增加了一个“Selceted sites to Include”下拉菜单框,此框包含:All sites(所有位点)、“Only

13、highlighted sites”(只显示相互之间有变异的位点)、“Only unhighlighted sites”(只显示相互之间无变异的位点)三个选项。如上图中的操作界面中的选项,点击“OK”按钮,则会弹出如下对话框:Fig可以看出,在此操作界面中,仅显示了有变异的位点。这样的数据形式在转化成“NetWork”遗传分析软件所需的数据格式时很方便。单击“Sequence Data Explorer” 操作界面的工具栏中“Data”中的“Setup/Selcet Genes&Domains”选项,会弹出如下对话框:Fig通过此操作界面可以检测、确定、选择结构域,为某些位点添加标签等。这个操

14、作界面包括两大部分:“Define/Edit/Select”和“Site Labels”。通过操作界面中“Genes/Domain”的子菜单“Data”可以设置,起始位点和末位点。通过“Codon Start”选项,可以选择编码的起始位置。在操作界面下端有一排按钮:“Add Gene”、“Add Domain”、“Delete/Edit”、“Expand”。通过“Add Gene”按钮可以添加或插入一个新的基因,通过“Add Domain”按钮可以添加或插入一个新的结构域,通过“Delete/Edit”按钮可以对数据进行编辑和删除,通过“Expand”可以展开数据,或仅显示第一水平的数据。点击

15、“Site Labels”按钮,上述操作界面变为如下图所示:Fig点击上述操作界面中的“Close”按钮,返回“Sequence Data Explorer”操作界面。选择工具栏“Data”下拉菜单中的“Setup/Select Taxa&Groups”选项,弹出如下图所示操作界面:Fig如上图操作界面,点击“New Group”按钮可以创建一个新的组,点击“Delete Group”按钮可以删除一个已经存在的组,在操作界面的中间竖排有五个按钮,同最上端两个按钮可以把数据移入或移出一个选定的组,点击第三个按钮可以对选定的组进行重新命名,点击“+”按钮可以创建一个新的组,点击“”按钮可以删除一个已经存在的组。注意,组的名字不能与任何一个样本重名。点击“Close”按钮,“Sequence Data Explorer”操作界面。点击此操作界面中的“Display”按钮,会弹出如下操作菜单:Fig从上述操作界面图看,下拉菜单共有:“Show Only Selected Sequences”(仅显示选中的序列)、“Use Identical Symbol”(利用同一标记符号)、“Color Cells”(色彩单元)、“Sort Sequences”(序列分类)、“Restore Input Order”(恢复输入序列的顺序)、“Show Sequence Names”(显示序列名

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号