今天看了下bowtie 的论文, 里面描述了BWT转换的过程和bowtie的比对算法: NGS测序数据的数据量非常大, 为了更快的处理, 通常需要对数据进行压缩:而BWT实际上就是一种数据转换方法, 将原始序列经过BWT转换后, 可以更方便的进行压缩:而且BWT转换是一个可逆的转换,能够根据转换后的序列还原出原始序列: BWT转换首先将序列进行在序列的末尾插入一个字符,并且规定按照字典序的排序的话, 这个字符小于序列中的任意字符: 比如原始序列: acaacg 首先在末尾添加一个$符号,变成 a…