1. RAxML 简介
RAxML (Random Axelerated Maximum Likelikhood) 能使用多线程或并行化使用最大似然法构建进化树。
网页版工具:http://epa.h-its.org/raxml/submit_single_gene
参考文献:RAxML version 8: a tool for phylogenetic analysis and post-analysis of large phylogenies
2. RAxML 下载与安装
$ wget https://github.com/stamatak/standard-RAxML/archive/v8.2.12.tar.gz -O ~/software/RAxML-v8.2.12.tar.gz $ tar zxf ~/software/RAxML-v8.2.12.tar.gz -C /opt/biosoft/ $ mv /opt/biosoft/standard-RAxML-8.2.12/ /opt/biosoft/RAxML-8.2.12/ $ cd /opt/biosoft/RAxML-8.2.12/ $ make -f Makefile.SSE3.PTHREADS.gcc -j 4 $ rm *.o $ make -f Makefile.AVX.PTHREADS.gcc -j 4 $ rm *.o $ source ~/.bashrc.mpich $ make -f Makefile.SSE3.HYBRID.gcc -j 4 $ rm *.o $ make -f Makefile.AVX.HYBRID.gcc -j 4 $ rm *.o $ chmod 755 /opt/biosoft/RAxML-8.2.12/usefulScripts/* $ echo 'PATH=$PATH:/opt/biosoft/RAxML-8.2.12/' >> ~/.bashrc $ source ~/.bashrc
2. RAxML 的使用
RaxML 软件包中带有一个 PDF 格式的 Manual 文档,介绍得非常详细。
2.1 RaxML 版本的选择
Sequential 版本适合于中小型的数据; PThreads 版本适合于长序列或多条序列;MPI 版本适合于较大(100~1000) bootstraps 的运行。
2.2 常用例子与参数
常用例子:
简单快速方式 $ raxmlHPC -f a -x 12345 -p 12345 -# 100 -m PROTGAMMALGX -s ex.phy -n ex -T 20 并行化软件支持,能最快速计算。并行化20个任务,每个任务使用8线程,能使用全部160线程计算资源: $ /opt/sysoft/mpich2-1.5/bin/mpirun -np 20 raxmlHPC -f a -x 12345 -p 12345 -# 100 -m PROTGAMMALGX -s ex.phy -n ex -T 8
RAxML 的参数非常多,设置非常复杂,上述常用例子的参数为:
-f a 此参数用于选择 RAxML 运算的算法。可以设定的值非常之多。 a 表示执行快速 Bootstrap 分析并搜索最佳得分的 ML 树。 -x 12345 指定一个 int 数作为随机种子,以启用快速 Bootstrap 算法。 -p 12345 指定一个随机数作为 parsimony inferences 的种子。 -# 100 指定 bootstrap 的次数。 -m PROTGAMMALGX 指定核苷酸或氨基酸替代模型。PROTGAMMALGX 的解释: "PROT" 表示氨基酸替代模型; GAMMA 表示使用 GAMMA 模型; X 表示使用最大似然法估计碱基频率。 -s ex.phy 指定输入文件。phy 格式的多序列比对结果。软件包中包含一个程序来将 fasta 格式转换为 phy 格式。 -n ex 输出文件的后缀为 .ex 。 -T 20 指定多线程运行的 CPUs 。
2.3 结果文件
RAxML_bootstrap.ex bootstrapped trees RAxML_bestTree.ex 最佳得分 ML 树 RAxML_bipartitions.ex 有 bootstrap 分值支持的最佳得分树,分值在 node 上。 RAxML_bipartionsBranchLabels.ex 有 bootstrap 分值支持的最佳得分树, 分值在 branch 上。FigTree不能识别此文件。
你好,请问RaxML可以定义HKY+G等模型吗?
source ~/.bashrc.mpich、
您好,我按照你的教程,安装跟你一样的版本RAxML,但是这一行命令我实现不了,我就用source ~/.bashrc,最后安装结束,发现RAxML-8.2.12这个文件夹里没有raxmlHPC,只有这个对应的四个版本,就是我使用命令我只能用raxmlHPC四个版本全名来运行命令,请问这样有问题吗?
是这样的,没有问题。
陈老师,得到结果文件好几个树,请问应该用哪一个树哇?还是说要根据后续分析而定?后面可以有哪些分析,分别用什么树呢?谢谢
软件的结果只有一棵树的。虽然生成文件有多个,都是需要的结果的结果文件,而常常需要的是其中一个文件而已。
老师您好,请问RAxML_bipartionsBranchLabels.ex 可以用什么软件识别?
用任何文本阅读器都可以读取。它是一个纯文本文件,内容就是一些人类可以阅读的字符。
老师你好,请问要设定什么参数才能得到这几个
RAxML_bestTree.ex 最佳得分 ML 树
RAxML_bipartitions.ex 有 bootstrap 分值支持的最佳得分树,分值在 node 上。
RAxML_bipartionsBranchLabels.ex 有 bootstrap 分值支持的最佳得分树, 分值在 branch 上。FigTree不能识别此文件。
树文件?
程序运行完毕就可以得到者几个文件。第二个文件输入给figtree即可
老师你好,请问要设置什么参数才能得到这几个树文件?
RAxML_bestTree.ex 最佳得分 ML 树
RAxML_bipartitions.ex 有 bootstrap 分值支持的最佳得分树,分值在 node 上。
RAxML_bipartionsBranchLabels.ex 有 bootstrap 分值支持的最佳得分树, 分值在 branch 上。FigTree不能识别此文件。
老师,您好! 我想问一下用RAxML建树的时候我有两个外群应该怎么分出来,每次跑程序的时候都提醒我“outgroups are not monophyletic, using first outgroup”,只识别第一个
老师,你好,这个方法是在那个系统上使用。
陈老师您好,
我用orthofinder找直系同源基因,然后用单拷贝基因画树,做树的时候参数选择 -T raxml,pbs提交集群了,walltime设置的240:00:00,两天了看还在Inferring remaining multiple sequence alignments and gene trees步骤,额,查了下raxml画树需要很长时间,我设置的这个10天是不是不够啊…..
老师你好,-m模型是如何算出设定的,raxml的最佳模型一般用什么得到?
谢谢