1. snoscan 和 snoGPS 简介
snoRNAs 主要有 2 种不同类型。其中 C/D box 类型 snoRNAs 用于指导甲基化修饰(2’O-ribose-methylations),该甲基化修饰位于核糖体 2′-OH上; H/ACA box 类型 snoRNAs 用于指导假尿苷酸化修饰(Pseudouridylation),即将尿嘧啶转换为假尿嘧啶。
snoscan用于鉴定 C/D box 类型 snoRNAs; snoGPS用于鉴定 H/ACA box 类型的 snoRNAs。
可以使用Snoscan Server 1.0 网页工具和snoGPS Server 1.0 网页工具进行 snoRNAs 预测。网页工具支持的最长序列长度为 100kb 。
2. snoscan 与 snoGPS 下载与安装
snoscan 的下载和安装:
$ wget lowelab.ucsc.edu/software/snoscan.tar.gz $ tar zxf snoscan.tar.gz -C /opt/biosoft/ $ cd /opt/biosoft/snoscan-0.9b/squid-1.5j $ perl -p -i -e 's/getline/get_line/g' sqio.c $ cd .. $ make $ echo 'PATH=$PATH:/opt/biosoft/snoscan-0.9b' >> ~/.bashrc $ perl -p -i -e 's#/usr/local/bin/perl#/usr/bin/perl#' sort-snos
snoGPS 的下载和安装:
$ wget http://lowelab.ucsc.edu/software/snoGPS-0.2.tar.gz $ tar zxf snoGPS-0.2.tar.gz -C /opt/biosoft/ $ cd /opt/biosoft/snoGPS-0.2/src $ perl -p -i -e 's/getline/get_line/g' lib/*.c squid/lib/*.c inc/*.h $ make $ cd .. $ ln -s src/pseudoU_test snoGPS $ echo 'PATH=$PATH:/opt/biosoft/snoGPS-0.2' >> ~/.bashrc $ source ~/.bashrc $ perl -p -i -e 's#/usr/local/bin/perl#/usr/bin/perl#' /opt/biosoft/snoGPS-0.2/scripts/*.pl $ echo 'export PERL5LIB=$PERL5LIB:/opt/biosoft/snoGPS-0.2/perlModules/' >> ~/.bashrc $ sudo cpan -i Class::MethodMaker File::Sort Bio::Tools::Run::Alignment::TCoffee
3. snoscan 的使用
snoscan的常用例子:
$ snoscan rRNA.fa genome.fasta -s -o out rRNA.fa : rRNA序列的fasta格式 genome.fasta : 用于搜索 snoRNAs 的基因组序列
snoscan的常用参数:
-h 打印帮助信息 -m string 指定包含甲基化位点信息的文件。该文件的格式为: >seq_A T 5 Verified meth site by TML C 12 Predicted by snoscan >My-seq-B G 1 Partially modified site A 6 Mapped by Maden 与fasta格式类似,头部是和 genome.fasta 序列名相同;内容部分分3列,以空格或制表符分割,第1列是位点的碱基,第2列是1-based的位点,第3列是60个字符以内的描述。 -o string 将结构输出到指定的文件,默认输出到标准输出 -s 是否保存 snoRNA 的序列到输出中
4. snoGPS 的使用
4.1 获得可能的假尿苷酸化位点序列
首先,提取 rRNA 序列信息中可能发生假尿苷酸化的位点。一般情况下,认为所有碱基为 U 的位点都可能发生假尿苷酸化修饰。通过程序将 碱基U及其侧翼10bp序列提取出来,提取出来,得到 target 文件。
$ /opt/biosoft/snoGPS-0.2/scripts/getRnaTargets.pl -n rRNA.fa -n 将所有的位点信息写入到一个文件中。 -r 制作反向 RNA 序列的 targets。 -f string 输入含有目标序列假尿苷酸化修饰的位点信息的文件。该文件格式例如: rRNA1 species 43:46:53 rRNA2 species 6:7:15:34:37:39:41:43:44:54:58:60:69:72:89:91 文件内容为用空格分割的3列。第1列是rRNA序列名;第2列是一个单词的描述;第3列是假尿苷酸位点。 -s string 比如输入 '656:989:2010',则对指定位点的尿苷酸制作 target 文件。默认下是对所有尿苷酸位点制作 target 文件。
4.2 运行snoGPS
snoGPS 的常用例子:
$ snoGPS -D 0 -S 15 -T snoGPS_tmp/uridin_target_file_for_snoGPS.txt \ -F snoGPS_hits.fa -L /opt/biosoft/snoGPS-0.2/scoretables/haca2stemv7.tables \ genome.fasta /opt/biosoft/snoGPS-0.2/desc/haca2stemv4a.desc > snoGPS_out genome.fasta : 在该基因组序列中鉴定 snoRNAs。 haca2stemv4a.desc : 该文件为 desc 文件,用于决定一些参数。对于human和yeast有不同的desc文件。 程序将主要结果输出到标准输出。
snoGPS 的常用惨素:
-h 打印帮助文档 -S float 设置得分阈值。 -T string 设置 target 文件,即含有可能的假尿苷酸化修饰位点信息的文件,由rRNA序列信息获得。 -F string 输出的 hits 文件。其中为 snoRNAs 序列。 -t int 设置从 target 文件中读取的 target 位点数目。 -L string 载入 score-tables 文件。snoGPS 提供了2个文件,分别适合于 human 和 yeast。该文件位于 /opt/biosoft/snoGPS-0.2/scoretables/ 目录下。 -W 仅仅对正链进行检测 -C 仅仅对负链进行检测
5. snoRNA 的一些知识点
Small nucleolar RNA 的 wikipedia。
snoRNA 指导的 rRNA 的转录后修饰有 2 种: 甲基化(Methylation) 和 假尿苷酸化(Pseudouridylation)。
snoRNP(small nucleolar ribonucleoprotein): 每个 snoRNA 和至少4个蛋白分子形成复合物,来指导目标RNA的修饰。
snoRNAs 主要有 2 种不同类型。其中 C/D box 类型用于指导甲基化修饰; H/ACA box 类型用于指导假尿苷酸化修饰。
C/D box 类型的 snoRNAs 包含 C(RUGAUGA)环 和 D(CUGA)环,分别在 snoRNA 的 5′ 和 3′ 端。如下图所示:
H/ACA box 类型的 snoRNAs 由 2 个发夹结构和 2 个单链区组成,称为 hairpin-hinge-hairpin-tail 结构,如下图所示。结构中包含 H box(ANANNA) 和 ACA box(ACA)。