一开始拿到三代测序的下机数据时,蒙了,readme ?三代测序的下机数据都有哪些,以及他们具体的格式是怎么样的(以sequel 平台为主). 测序过程 SMRTbell A adapter通用接头,两端的接头可以一样也可以不一样 B barcode(客户自己设计) I insert 插入片段,即我们测序的目的片段 由于SMRTbell是环状的,测序过程是边合成边测序,因此可以沿着新链合成的方向不停地读取序列,读取一圈又一圈,直到聚合酶累趴下了… 测序结果 根据SMRTbell的
转载:http://www.cnblogs.com/jinhh/p/8328818.html 三代测序的下机数据都有哪些,以及他们具体的格式是怎么样的(以sequel 平台为主). 测序过程 SMRTbell A adapter通用接头,两端的接头可以一样也可以不一样 B barcode(客户自己设计) I insert 插入片段,即我们测序的目的片段 由于SMRTbell是环状的,测序过程是边合成边测序,因此可以沿着新链合成的方向不停地读取序列,读取一圈又一圈,直到聚合酶累趴
主流工具: FastQC fqcheck readfq 拿到测序数据的第一步就是做质量控制 fqcheck之后得到的结果: 它会统计每条reads,按read 1-100位点计算每个位置的ACGTN含量,以及0-41质量值的个数 最终会得到整体的错误率,GC,Q20,Q30 the default quality , sequences, total , average length:100.00 Standard deviations at 0.25: total 0.00%, per bas
1. 对原始下机fastq文件进行过滤和比对(mapping) 对于Illumina下机数据推荐使用bwa进行mapping. Bwa比对步骤大致如下: (1)对参考基因组构建索引: 例子:bwa index -a bwtsw hg19.fa.最后生成文件:hg19.fa.amb.hg19.fa.ann.hg19.fa.bwt.hg19.fa.pac和hg19.fa.sa. 构建索引时需要注意的问题:bwa构建索引有两种算法,两种算法都是基于BWT的,这两种算法通过参数-a is 和-a bwt