有关non-coding RNA的知识

1. rRNA

1.1 rRNA,即核糖体RNA,是3类RNA(tRNA,mRNA,rRNA)中相对分子质量最大,数量最多的一类RNA。它与蛋白质结合而形成核糖体,其功能是作为mRNA的支架,使mRNA分子在其上展开,实现蛋白质的合成。

1.2 原核生物和真核生物的核糖体均由大、小两种亚基组成。原核生物中,5S 和 23S rRNAs 在大亚基(large subunit)中, 16S rRNA 在小亚基(small subunit)中; 真核生物中,5S, 5.8S 和 28S rRNAs 在大亚基中,18S rRNA 在小亚基中。

1.3 原核生物中的 16S, 23S 和 5S rRNAs 通常串联在一起进行转录;真核生物中 18S, 28S 和 5.8S rRNAs 在一起形成一个转录单元,而 5S rRNA 则则为高度串联重复。

1.4 在大部分物种中,全基因组上一般有几个拷贝的 rRNA 转录单元,这些转录单元的序列差异通常很低,低于1%。最高的也只有11%。

RNAmmer的安装和使用

1. RNAmmer简介

RNAmmer是用来预测rRNA的软件。其官网页工具:RNAmmer 1.2 Server

参考文献:Lagesen K, Hallin P, Rødland E A, et al. RNAmmer: consistent and rapid annotation of ribosomal RNA genes[J]. Nucleic acids research, 2007, 35(9): 3100-3108.

RNAmmer的正常运行需要:1. perl的Getopt::Long和XML::Simple模块; 2. hmmsearch,需要安装hmmer-2.2g版本,使用最新版本会出错。

2. RNAmmer的安装和运行

下载并安装hmmer-2.2g
$ wget ftp://selab.janelia.org/pub/software/hmmer/2.2g/hmmer-2.2g.tar.gz
$ tar zxf hmmer-2.2g.tar.gz
$ cd hmmer-2.2g
$ ./configure --prefix=/opt/biosoft/hmmer-2.2g
$ mkdir -p /opt/biosoft/hmmer-2.2g/man/man1/ /opt/biosoft/hmmer-2.2g/bin
$ make; make install

安装RNAmmer,该软件需要使用edu邮箱去申请。
$ mkdir -p /opt/biosoft/rnammer-1.2
$ tar zxf rnammer-1.2.src.tar.Z -C /opt/biosoft/rnammer-1.2
$ perl -p -i -e 's/(my \$INSTALL_PATH).*/$1 = \"\/opt\/biosoft\/rnammer-1.2\";/' /opt/biosoft/rnammer-1.2/rnammer
$ perl -p -i -e 's/^(\s+\$HMMSEARCH_BINARY).*/$1 = \"\/opt\/biosoft\/hmmer-2.2g\/bin\/hmmsearch\";/' /opt/biosoft/rnammer-1.2/rnammer

检测是否正常运行
$ /opt/biosoft/rnammer-1.2/rnammer -S bac -multi -f rRNA.fasta\
 -h rRNA.hmmreport -xml rRNA.xml -gff rRNA.gff2\
 /opt/biosoft/rnammer-1.2/example/ecoli.fsa

3. RNAmmer的运行与参数

运行/opt/biosoft/rnammer-1.2/rnammer命令,参考manual文件/opt/biosoft/rnammer-1.2/man/rnammer.1, 该程序的运行参数如下:

USAGE:
$ rnammer [options] sequence.fasta

-S  指定输入序列的物种所属的界: arc bac 或 euk

-gff  生成的gff文件结果

-m  所需要预测的moleculers: 'tsu' for 5/8s rRNA, 'ssu' for 16/18s rRNA, 'lsu' for 23/28s rRNA。如果全部进行预测,则该参数后为 'tsu,ssu,lsu'。

-multi  并行运算,预测正反两条链上所有的moleculers。最多并行运行6个计算。使用该参数,则不需要上一个参数。

-f  生成的rRNA的fasta结果文件

-h  生成的hmm报告结果

-gff  生成的rRNA的gff2文件

-x  生成的xml结果文件

对真核生物基因组进行rRNA预测的一个示例命令:

$ /opt/biosoft/rnammer-1.2/rnammer -S euk -multi -f rRNA.fasta\
 -h rRNA.hmmreport -xml rRNA.xml -gff rRNA.gff2 genome.fasta

4. RNAmmer的结果

rRNA.fasta,rRNA.gff2,rRNA.hmmreport,rRNA.xml。