mega软件的使用1.doc－金锄头文库

资源描述

《mega软件的使用1.doc》由会员分享，可在线阅读，更多相关《mega软件的使用1.doc（61页珍藏版）》请在金锄头文库上搜索。

1、MEGA软件的使用Mega软件输入数据的格式Mega软件输入数据的格式比较简单，在众多遗传学分析软件中是比较容易制作的一种。首先，如果输入数据是一般的DNA或RNA序列，则有如下要求：1）文件扩展名以*.meg或*.txt结尾都行；2）输入数据文件，第一行必须有Mega程序所需的特殊标记“#MEGA”；3）“TITLE”位于输入文件的第二行，后边可以跟上一些说明性字符，这些字符在输出结果中会显示出来。在与“Title”同一行上的字符才有效，而且字符总数不能超过128，超过的也会被忽略。4）在“#MEGA”和“TITLE”之后，在分析数据之前可以一行或多行的说明性文字。这些文字可用来说明诸如作者

2、、分析日期、分析目的等信息。5）在每个数据（或每条序列）的名字之前应该有一个“#”，名字的下一行是具体的序列。在同一个数据文件里，不能出现数据名相同的序列。在数据名及具体序列中，空格和TAB是被忽略的。6）在同一数据文件内，所有序列的长度应该保持一致，否则，程序不能执行。 7）对于DNA或RNA序列，Mega软件能够识别A、T、C、G、U五种字符，缺失字符可以用“？”表示，比对时的空缺位点可以用“”表示。下边是一个数据文件示例：Fig其次，如果输入数据是遗传距离矩阵，则要求如下：1）前4点要求同对上述DNA序列的要求相同；2）在每个距离矩阵的名字之前应该有一个“#”，每个名字占一行；先列出距离

3、矩阵的名字，然后再给出距离矩阵；3）距离矩阵有两种形式，下三角和上三角。下边是一个数据文件示例：Fig下图是距离矩阵的示意图，左边是下三角矩阵，右边是上三角矩阵。Fig再次，如果数据是测序图谱的形式，直接导入即可。下图是测序图谱示例：FigMEGA界面及操作Mega是一款操作十分简便的遗传学分析软件，其界面十分友好，即使初学者也很易上手。1、数据的录入及编辑Mega软件能够接受多种数据格式，如FASTA格式、Phylip格式、PAUP数据格式等等。而且Mega软件专门提供了把其他格式的数据转换位Mega数据格式的程序。首先，打开Mega程序，有如下图所示的操作界面：Fig单击工具栏中的“Fil

4、e”按钮，会出现如下图所示的菜单：Fig从上图可以看出，下拉菜单有“Open Data”（打开数据）、“Reopen Data”（打开曾经打开的数据，一般会保留新近打开的几个数据）、“Close Data”（关闭数据）、“Export Data”（导出数据）、“Conver To MEGA Format”（将数据转化为MEGA格式）、“Text Editor”（数据文本编辑）、“Printer Setup”（启动打印）、“Exit”（退出MEGA程序）。单击“Open Data”选项，会弹出如下菜单：Fig浏览文件，选择要分析的数据打开，单击“打开”按钮，会弹出如下操作界面：Fig此程序操作界

5、面，提供了三种选择数据选择：Nucleotide Sequences（核苷酸序列）、Protein Sequences（蛋白质序列）、Pairwise Distance（遗传距离矩阵）。根据输入数据的类型，选择一种，点击“OK”即可。如果选择“Pairwise Distance”，则操作界面有所不同；如下图所示：Fig根据遗传距离矩阵的类型，如果是下三角矩阵，选择“Lower Left Matrix”即可；如果是上三角矩阵，选择“Upper Right Matrix”即可。点击“OK”按钮，即可导入数据。如果是核苷酸数据，则读完之后，会弹出如下对话框：Fig如上图，如果是编码蛋白质的核苷酸序列

6、，则选择“Yes”按钮；如果是不编码蛋白质的核苷酸序列，则点击“No”按钮。之后，会弹出如下操作窗口：Fig此作界面的名称是“Sequence Data Explorer”，在其最上方是工具栏“Data”、“Display”、“Highlight”等，然后是一些数据处理方式的快捷按钮，在操作界面的左下方是每个序列的名称。显示序列占了操作界面的绝大部分，与第一个序列相同的核苷酸用“.”表示，发生变异的序列则直接显示。如果在弹出的对话框中，点击“OK”，即选择输入的数据是编码蛋白质的DNA序列。那么会再弹出如下对话框：Fig此操作界面提供了多种生物的遗传密码方式的选择，如Vertebrate Mi

7、tochondrial（脊椎动物线粒体）、Invertebrate Mitochondrial（非脊椎动物线粒体）、Yeast Mitochondrial（酵母线粒体）等等。点击此操作界面的“Add”按钮，可以添加密码子表格，其编辑界面如下图所示：Fig通过此操作界面可以创建、修改密码子表格。点击“OK”按钮可以返回“Select Genetic Code”操作界面。点击“Select Genetic Code”操作界面的“Delect”按钮，可以删除一个密码子表。点击“Select Genetic Code”操作界面的“Edit”按钮，可以对已经存在的密码子表格。其操作界面与“Geneti

8、c Code Table”相同。点击“Select Genetic Code”操作界面的“View”按钮，可以浏览选中的密码子表格。点击“Select Genetic Code”操作界面的“Statistics”按钮，可以统计密码子表格的一些信息，如每种密码子的频率、同义位点数、非同义位点数等。点击点击“Select Genetic Code”操作界面的“OK”按钮，会弹出如上图所示的“Sequence Data Explorer”操作界面。如果点击“Cancel”按钮，也会弹出此操作界面，但是此时会把数据默认为非编码的DNA序列。单击“Sequence Data Explorer”操作界面工

9、具栏的“Data”按钮，有如下图所示的下拉菜单：Fig下拉菜单有六个选项：“Write Data To File”（将数据转到文件中，利用此选项可以把Mega数据格式的数据转化成其它格式）、“Translate/Untranslate”（是否翻译，这个选项只有所分析的DNA序列是编码序列时才被激活）、“Selcet Genetic Code Table”（选择遗传密码表，这个选项只有所分析的DNA序列是编码序列时才被激活）、“Setup/Selcet Genes&Domains”（选择或设置基因或结构域）、“Setup/Select Taxa&Group”（对数据进行分组）、“Quit Dat

10、a Viewer”（退出此浏览框）。单击“Write Data To File”选项，会弹出如下对话框：FigTitle框显示的内容是数据文件中“TITLE”之后的内容。Description框显示的内容是数据文件中对整体数据描述的内容。Format选项提供一个下来菜单，通过此下拉菜单可以把数据转化为MEGA格式、Nexus（PAUP4.0）格式，PHYLIP3.0格式、Nexus（PAUP3.0/MacClade）格式。Writing site numbers 选项也提供一个下拉菜单，通过此下来菜单可以把给每个核苷酸标序号，“None”为不显示序号，“For each site”为每个位点显

11、示序号，“At the end of line”在每一行行末显示序号。 Missing Data and alignment gaps选项也提供了一个下拉式菜单，这个菜单包括：“Include sites with miss/ambiguous data gaps”（显示缺失位点及模糊位点以及空缺）、“Exclude sites with miss/ambiguous data gaps”（不显示缺失位点及模糊位点以及空缺）、“Exclude sites with miss/ambiguous data only” （仅不显示缺失位点及模糊位点）、“Exclude sites with ali

12、gnment gaps only”（仅不显示比对是的空缺部分）。如上述操作界面中的选项，点击“OK”按钮，会弹出如下界面：Fig此操作界面中的文字可以拷贝到文本文档中。如果在“Squence Data Explorer” 操作界面的工具栏中选择“Highlight”中的“Varible sites”选项，则单击“Write Data To File”选项，会弹出如下对话框：Fig我们会发现与上述“Exporting Sequence Data”操作界面相比，在最下方增加了一个“Selceted sites to Include”下拉菜单框，此框包含：All sites（所有位点）、“Only

13、highlighted sites”（只显示相互之间有变异的位点）、“Only unhighlighted sites”（只显示相互之间无变异的位点）三个选项。如上图中的操作界面中的选项，点击“OK”按钮，则会弹出如下对话框：Fig可以看出，在此操作界面中，仅显示了有变异的位点。这样的数据形式在转化成“NetWork”遗传分析软件所需的数据格式时很方便。单击“Sequence Data Explorer” 操作界面的工具栏中“Data”中的“Setup/Selcet Genes&Domains”选项，会弹出如下对话框：Fig通过此操作界面可以检测、确定、选择结构域，为某些位点添加标签等。这个操

14、作界面包括两大部分：“Define/Edit/Select”和“Site Labels”。通过操作界面中“Genes/Domain”的子菜单“Data”可以设置，起始位点和末位点。通过“Codon Start”选项，可以选择编码的起始位置。在操作界面下端有一排按钮：“Add Gene”、“Add Domain”、“Delete/Edit”、“Expand”。通过“Add Gene”按钮可以添加或插入一个新的基因，通过“Add Domain”按钮可以添加或插入一个新的结构域，通过“Delete/Edit”按钮可以对数据进行编辑和删除，通过“Expand”可以展开数据，或仅显示第一水平的数据。点击

15、“Site Labels”按钮，上述操作界面变为如下图所示：Fig点击上述操作界面中的“Close”按钮，返回“Sequence Data Explorer”操作界面。选择工具栏“Data”下拉菜单中的“Setup/Select Taxa&Groups”选项，弹出如下图所示操作界面：Fig如上图操作界面，点击“New Group”按钮可以创建一个新的组，点击“Delete Group”按钮可以删除一个已经存在的组，在操作界面的中间竖排有五个按钮，同最上端两个按钮可以把数据移入或移出一个选定的组，点击第三个按钮可以对选定的组进行重新命名，点击“+”按钮可以创建一个新的组，点击“”按钮可以删除一个已经存在的组。注意，组的名字不能与任何一个样本重名。点击“Close”按钮，“Sequence Data Explorer”操作界面。点击此操作界面中的“Display”按钮，会弹出如下操作菜单：Fig从上述操作界面图看，下拉菜单共有：“Show Only Selected Sequences”（仅显示选中的序列）、“Use Identical Symbol”（利用同一标记符号）、“Color Cells”（色彩单元）、“Sort Sequences”（序列分类）、“Restore Input Order”（恢复输入序列的顺序）、“Show Sequence Names”（显示序列名

展开阅读全文

mega软件的使用1.doc

最新文档