使用 HISAT 将转录组数据 mapping 到基因组序列

1. HISAT 简介

HISAT:hical Indexing for Spliced Alignment of Transcripts。该软件和 tophat 开发于同一个单位,它相当于 tophat 的升级版,比对速度比 tophat2 快50倍。

2. HISAT 的下载和安装

$ wget http://www.ccb.jhu.edu/software/hisat/downloads/hisat-0.1.5-beta-Linux_x86_64.zip
$ unzip hisat-0.1.5-beta-Linux_x86_64.zip -d /opt/biosoft/
$ echo 'PATH=$PATH:/opt/biosoft/hisat-0.1.5-beta/' >> ~/.bashrc
$ source ~/.bahsrc

2. HISAT 使用

2.1 构建索引文件
$ hisat-build genome.fasta genome

2.2 进行比对 产用的命令与参数示例:

$ hisat -x genome -u 1000000 -p 24 -I 0 -X 500 --rna-strandness RF -1 reads.1.fastq -2 reads.2.fastq -U single.fastq -S result.sam 

hisat 与 bowtie2 的参数基本一致,常用的参数:

-x    输入索引数据库
-1    输入 reads1
-2    输入 reads2
-U    输入单段序列
-u    仅对前多少个reads进行比对
-I    最小插入片段长度
-X    最大插入片段长度
-S    输出sam文件
--rna-strandness 链特异性测序,一般为 RF
-k    一个reads比对到多个地方,报告几个结果,默认为 5 。

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据