使用 RAxML 构建进化树

1. RAxML 简介

RAxML (Random Axelerated Maximum Likelikhood) 能使用多线程或并行化使用最大似然法构建进化树。
网页版工具:http://epa.h-its.org/raxml/submit_single_gene
参考文献:RAxML version 8: a tool for phylogenetic analysis and post-analysis of large phylogenies

2. RAxML 下载与安装

$ wget https://github.com/stamatak/standard-RAxML/archive/v8.2.12.tar.gz -O ~/software/RAxML-v8.2.12.tar.gz
$ tar zxf ~/software/RAxML-v8.2.12.tar.gz -C /opt/biosoft/
$ mv /opt/biosoft/standard-RAxML-8.2.12/ /opt/biosoft/RAxML-8.2.12/
$ cd /opt/biosoft/RAxML-8.2.12/
$ make -f Makefile.SSE3.PTHREADS.gcc -j 4
$ rm *.o
$ make -f Makefile.AVX.PTHREADS.gcc -j 4
$ rm *.o
$ source ~/.bashrc.mpich
$ make -f Makefile.SSE3.HYBRID.gcc -j 4
$ rm *.o
$ make -f Makefile.AVX.HYBRID.gcc -j 4
$ rm *.o
$ chmod 755 /opt/biosoft/RAxML-8.2.12/usefulScripts/*
$ echo 'PATH=$PATH:/opt/biosoft/RAxML-8.2.12/' >> ~/.bashrc
$ source ~/.bashrc

2. RAxML 的使用

RaxML 软件包中带有一个 PDF 格式的 Manual 文档,介绍得非常详细。

2.1 RaxML 版本的选择

Sequential 版本适合于中小型的数据; PThreads 版本适合于长序列或多条序列;MPI 版本适合于较大(100~1000) bootstraps 的运行。

2.2 常用例子与参数

常用例子:

简单快速方式
$ raxmlHPC ­-f a ­-x 12345 ­-p 12345 ­-# 100 ­-m PROTGAMMALGX ­-s ex.phy ­-n ex -T 20

并行化软件支持,能最快速计算。并行化20个任务,每个任务使用8线程,能使用全部160线程计算资源:
$ /opt/sysoft/mpich2-1.5/bin/mpirun -np 20 raxmlHPC ­-f a ­-x 12345 ­-p 12345 ­-# 100 ­-m PROTGAMMALGX ­-s ex.phy ­-n ex -T 8

RAxML 的参数非常多,设置非常复杂,上述常用例子的参数为:

-f a
此参数用于选择 RAxML 运算的算法。可以设定的值非常之多。 a 表示执行快速 Bootstrap 分析并搜索最佳得分的 ML 树。
-x 12345
指定一个 int 数作为随机种子,以启用快速 Bootstrap 算法。
-p 12345
指定一个随机数作为 parsimony inferences 的种子。
-# 100
指定 bootstrap 的次数。
-m PROTGAMMALGX
指定核苷酸或氨基酸替代模型。PROTGAMMALGX 的解释: "PROT" 表示氨基酸替代模型; GAMMA 表示使用 GAMMA 模型; X 表示使用最大似然法估计碱基频率。
-s ex.phy
指定输入文件。phy 格式的多序列比对结果。软件包中包含一个程序来将 fasta 格式转换为 phy 格式。
-n ex
输出文件的后缀为 .ex 。
-T 20
指定多线程运行的 CPUs 。

2.3 结果文件

RAxML_bootstrap.ex           bootstrapped trees
RAxML_bestTree.ex            最佳得分 ML 树
RAxML_bipartitions.ex        有 bootstrap 分值支持的最佳得分树,分值在 node 上。
RAxML_bipartionsBranchLabels.ex 有 bootstrap 分值支持的最佳得分树, 分值在 branch 上。FigTree不能识别此文件。

使用 RAxML 构建进化树》上有10个想法

  1. source ~/.bashrc.mpich、
    您好,我按照你的教程,安装跟你一样的版本RAxML,但是这一行命令我实现不了,我就用source ~/.bashrc,最后安装结束,发现RAxML-8.2.12这个文件夹里没有raxmlHPC,只有这个对应的四个版本,就是我使用命令我只能用raxmlHPC四个版本全名来运行命令,请问这样有问题吗?

  2. 陈老师,得到结果文件好几个树,请问应该用哪一个树哇?还是说要根据后续分析而定?后面可以有哪些分析,分别用什么树呢?谢谢

    • 软件的结果只有一棵树的。虽然生成文件有多个,都是需要的结果的结果文件,而常常需要的是其中一个文件而已。

  3. 老师你好,请问要设定什么参数才能得到这几个
    RAxML_bestTree.ex 最佳得分 ML 树
    RAxML_bipartitions.ex 有 bootstrap 分值支持的最佳得分树,分值在 node 上。
    RAxML_bipartionsBranchLabels.ex 有 bootstrap 分值支持的最佳得分树, 分值在 branch 上。FigTree不能识别此文件。
    树文件?

  4. 老师你好,请问要设置什么参数才能得到这几个树文件?
    RAxML_bestTree.ex 最佳得分 ML 树
    RAxML_bipartitions.ex 有 bootstrap 分值支持的最佳得分树,分值在 node 上。
    RAxML_bipartionsBranchLabels.ex 有 bootstrap 分值支持的最佳得分树, 分值在 branch 上。FigTree不能识别此文件。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据