HISAT2是一款用于“对应(map)”二代测序数据(全基因组、转录组和外显子组)至目标基因组的工具,用来替代HISATTopHat2。本文汇集一些使用HISAT2的常见问题问答。

1. 如何解读HISAT2的输出统计?

一个常见的双端测序样本HISAT2输出统计:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
10000 reads; of these:
  10000 (100.00%) were paired; of these:
    650 (6.50%) aligned concordantly 0 times
    8823 (88.23%) aligned concordantly exactly 1 time
    527 (5.27%) aligned concordantly >1 times
    ----
    650 pairs aligned concordantly 0 times; of these:
      34 (5.23%) aligned discordantly 1 time
    ----
    616 pairs aligned 0 times concordantly or discordantly; of these:
      1232 mates make up the pairs; of these:
        660 (53.57%) aligned 0 times
        571 (46.35%) aligned exactly 1 time
        1 (0.08%) aligned >1 times
96.70% overall alignment rate
  • 总共10000对reads;

  • 8823对concordant pairs(一对既方向匹配又有合适距离的reads)有1次精确比对;527对concordant pairs有1次以上比对;34对disconcordant pairs;

  • 616对不是concordant pairs,也不是disconcordant pairs中,571个reads有1次精确比对;1个read有1次以上比对;660个reads没有比对成功。

  • 因此,整体比对率为1 - (660 / 2) / 10000

2. 使用HISAT2前,是否需要对原始数据进行清洗?

需要。

更新记录

2016年9月10日

Comments