在二代测序数据分析中,非常重要的一步是将测得的短序列“对应”到基因组上。所使用的工具被称为“短序列比对工具(short sequence aligners)”。以下是一些常用工具的介绍。

1. Bowtie

简介Bowtie2是现在广泛使用的序列比对工具。

运行方式:所有平台

特点

  • 相比较Bowtie1,处理大于50bp的短序列,速度更快、也更敏感。Bowtie1在处理小于50bp的短序列上,效果更好。

  • iGenomes提供一些事先编排(index)的基因组。

安装和使用Octopress的一些注意事项,详细的内容可以参考网址

1. 安装

请参考官网,其他的博客介绍的安装已经失效或者错误。

常用命令:

1
2
# 预览,可自动更新。使用Ctrl+c终止。
$ rake preview

2. Ruby版本调整

因为Octopress需要使用Ruby旧版本,推荐使用RVM安装Ruby 1.9.3版本。在安转过程中可能会出现"gpg: Can't check signature: public key not found"的错误提示,需要执行一下类似命名,添加公用匙。

1
$ gpg2 --keyserver hkp://keys.gnupg.net --recv-keys D39DC0E3

使用以下操作设定ruby版本:

1
2
$ source ~/.rvm/scripts/rvm
$ rvm use 1.9.3

TopHatCufflinks和cummeRbund,被称为处理RNA-seq数据的“燕尾服(tuxedo)”。TopHat负责RNA-seq的reads映射比对到基因组,并且自动识别mRNA“内含子-外显子”剪切;Cufflinks擅长组装转录组和寻找差异表达基因(或转录起始位点TSS等);cummeRbund主攻数据可视化。

最新版本的R已经内置parallel包,parallel包是从snow包和multicore包继承而来,包含了很多非常好用的函数。parallel包可以通过PVM(rpvm包)、MPI(Rmpi包)、NetWorkSpaces(nws包)和raw sockets(如果以上3种都不能使用)平台进行分布计算,支持cluster和多核个人/服务器计算机。在Linux系统上,通常使用openMPI

1. 安装Rmpi

因为使用openMPI,所以parallel包需要Rmpi包来设定节点,所以首先需要在计算机上安装openMPI。