如何用MEGA5.0和Clustalx1.83构建进化树

如题所述

MEGA是一个关于序列分析以及比较统计的工具包,从3.1版本到后来的4.0版本一直都广为大家熟悉,现在推出了Mega5.0版本。功能比以前多有改进。现主要介绍使用Mega 5.0构建系统进化树的方法。供大家参考。
用MEGA构建进化树有以下步骤:
1、测序:
将克隆扩增测序得到的16S rDNA序列进行测序。
2、NCBI上做Blast
找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后寻找相似性最高的细菌,通常把该属的序列(Fasta格式文件)下载下来,或点击GenBank登录号,复制FSATA格式,整合在一个*.txt文档中(单独建立一个文件夹存放,后面的很多文件会自动装入该文件夹),如
>XXXX
AGGCTTAACACATGCAAGTCGAGCGGAGCGAGGGTGCTTGCACCTTAGCTTAGCGGCGGACGGGTGAGTAATGCTTAGGAATCTGCCTATTAGTGGGGGACAACATTCCGAAAGGAATGCTAATACCGCATACGCCCTACGGGGGAAAGCAGGGGATCTTCGGACCTTGCGCTAATAGATGAGCCTAAGTCGGATTAGCTAGTTGGTGGG

>gi|289469964|gb|GU388381.1| Acinetobacter tandoii strain DSM 14970 16S ribosomal RNA gene, partial sequence
ACTTAGCGGCGGACGGGTGAGTAATGCTTAGGAATCTGCCTATTAGTGGGGGACAACATTCCGAAAGGGATGCTAATACCGCATACGCCCTACGGGGGAAAGCAGGGGATCTTCGGACCTTGCGCTAATAGATGAGCCTAAGTCGGATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCTGTAGCGGGTCTGAGAGGATGA……
…………………….
参考序列选择注意事项:
1、不选非培养(unclutured)微生物为参比;
2、不选未定分类地位的微生物,最相近的仅作参考;c,在保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。
3、 使用clustalx1.83进行序列比对
打开压缩文件clustalx1.83,运行其中的clustalx.exe文件,如图:

点击File/load sequences,将整理好的*.txt序列文件导入clustalx1.83,如图

接着点击
Alignment/Do Complete Aligment

程序自动运行,得出结果,自动输出*.aln 和* .dnd 为后缀的两个文件,并自动存入你*.txt文件所在的文件夹内。

序列比对也可以直接用MEGA来做。
4、运行程序MEGA 5.0,如下图所示:

点击:File导入Clustal程序得到的*.aln文件。再点File/Convert to MEGA Format,打开转换文件对话框,从目的文件夹中选中Clustal 对比分析后所产生的*.aln文件,转换为*.meg文件。转换时一路确认相关界面。最后查看meg序列文件最后是否正常,命名新文件存盘保存*.meg文件,*.meg文件会和aln文件保存在上述*.txt同一个文件夹中。

5、 关闭转换窗口,回到主窗口,现在点面板上的“Click me to activate a data file”打开刚才的*.meg文件。

如果为核酸序列,选择“Nucleotide sequence”,点击“OK”,得到以下图示。

选择默认的Standard,点击OK后,如图所示。

点击程序中的,可以得到下图

在另外一个窗口内,出现以下数据文件点击选择和编辑数据分类图标, 可对所选择的序列进行编辑,完成后点击close即可。

序列编辑完成后,可进行保存,点击保存后出现以下界面,点击ok即可。

构建进化树的算法两类主要方法简要说明:
独立元素法(discrete character methods)是指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决定的(例如:一个序列上可能包含很多的酶切位点,而每个酶切位点的存在与否是由几个碱基的状态决定的,也就是说一个序列碱基的状态决定着它的酶切位点状态,当多个序列进行进化树分析时,进化树的拓扑形状也就由这些碱基的状态决定了)。
距离依靠法(distance methods)是指进化树的拓扑形状由两两序列的进化距离决定的。进化树枝条的长度代表着进化距离。独立元素法包括最大简约性法(Maximum Parsimony methods)和最大可能性法(Maximum Likelihood methods);距离依靠法包括除权配对法(UPGMAM)和邻位相连法(Neighbor-joining)。
(1) phylogeny→UPGMA

(2)用Bootstrap构建进化树,MEGA的主要功能就是做Bootstrap验证的进化树分析,Bootstrap验证是对进化树进行统计验证的一种方法,可以作为进化树可靠性的一个度量。各种算法虽然不同,但是操作方法基本一致。进化树的构建是一个统计学问题。我们所构建出来的进化树只是对真实的进化关系的评估或者模拟。如果我们采用了一个适当的方法,那么所构建的进化树就会接近真实的“进化树”。模拟的进化树需要一种数学方法来对其进行评估。不同的算法有不同的适用目标。一般来说,最大简约性法适用于符合以下条件的多序列:i 所要比较的序列的碱基差别小,ii 对于序列上的每一个碱基有近似相等的变异率,iii 没有过多的颠换/转换的倾向,iv 所检验的序列的碱基数目较多(大于几千个碱基);用最大可能性法分析序列则不需以上的诸多条件,但是此种方法计算极其耗时。如果分析的序列较多,有可能要花上几天的时间才能计算完毕。
具体构建过程如下
① 参数的设置:点击,选择该菜单中的Construct/test Neighbor-Joining tree,
选择前面转换得到的*meg文件,得到下图
温馨提示:答案为网友推荐,仅供参考