tRNAscan-SE 的使用

1. tRNAscan-SE 简介

tRNAscan-SE 能在基因组水平上进行 tRNA 扫描。该软件实际上是一个 perl 脚本,整合了 tRNAscan、 EufindRNA 和 Cove 这 3 个独立的 tRNA 检测软件。tRNAscan-SE 首先调用 tRNAscan 和 EufindRNA 鉴定基因组序列中的 tRNA 区域,然后调用 Cove 进行验证。这样既保证了前者的 sensitivities, 又保证了后者较低的假阳性概率,同时在搜索速度上提升了很多。
有关 tRNAscan-SE 的详细说明,参考其本地化软件包中的 man 文档。
tRNAscan-SE 的网页版:http://lowelab.ucsc.edu/tRNAscan-SE/。但一次最多只能进行 5M bp 序列的 tRNA 预测。

2. tRNAscan-SE 本地安装

$ wget http://lowelab.ucsc.edu/software/tRNAscan-SE.tar.gz
$ tar zxf tRNAscan-SE.tar.gz
$ cd tRNAscan-SE-1.3.1
$ perl -p -i -e 's#\$\(HOME\)#/opt/biosoft/tRNAscan-SE-1.3.1#' Makefile
$ make && make install
$ make testrun
$ echo 'PATH=$PATH:/opt/biosoft/tRNAscan-SE-1.3.1/bin/' >> ~/.bashrc
$ echo 'PERL5LIB=$PERL5LIB:/opt/biosoft/tRNAscan-SE-1.3.1/bin/' >> ~/.bashrc
$ source ~/.bashrc

3. tRNAscan-SE 的使用

常用例子与主要参数:

$ tRNAscan-SE -o tRNA.out -f rRNA.ss -m tRNA.stats genome.fasta

-A 适合于古细菌。该参数选择了古细菌特异性的covariance model(cm),同时稍微放宽了 EufindtRNA 的 cutoffs。
-B 适合于细菌。默认情况下,不选择,-A -B -G 或 -O 参数,则适合于真核生物。
-G 适合于古细菌,细菌和真核生物的混合序列。该参数使用 general tRNA covariance model。
-O 适合于线粒体和叶绿体。选择该参数,则仅使用 Cove 进行分析,搜索速度会很慢,同时也不能给出 pseudogenes 检测。
-i 使用 Infernal cm analysis only。该参数设置后,需要 cmsearch 命令,但是 tRNAscan-SE 软件包中貌似没有该程序,最终无法运行。
-C 仅使用 Cove 进行 tRNA 分析。虽然从一定程度上提高了准确性,但是会极慢,当然不建议了。
-o <file> 将结果保存到文件。
-f <file> 将 tRNA 的二级结构结果保存到文件
-m <file> 将统计结果保存到文件。

4. tRNAscan-SE 的结果说明

在真核生物中,tRNA 由 RNA 聚合酶III 在核内转录生成 pre-tRNA, 再进行加工生成有功能的 tRNA 分子(特别是一些 tRNA 序列还含有内含子)。若 tRNA 存在内含子,则结果文件中第 7 8 列会给出内含子区间,否则其值为 0 。
tRNAscan-SE 的结果中, 如果 begin 比 end 的值大,则表示 tRNA 在负义链上。
有些结果中第 5 列为 pseudogene, 这表示其一级或二级结构比较差。
最后一列是 Cove Score,该分值最低阈值为 20 。该值是一个 log ratio值。ratio 是符合 tRNA covariance model概率与随机序列模型概率的比值。
当然,最后最好是将表格格式结果转换为 GFF3 结果,以利于在基因组上的可视化。

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据