Est--编码序列,gene 片段且具有标签 其中,est数据库中是类似测序1.测序2.测序3这样的序列.实验室测得的序列是cDNA,通过上图方法拼接,电脑克隆(dbest).如果有overlap则认为两个序列来自于同一个gene,overlap的碱基数目是40(不建议低于30,不建议高于40),过少容易拼接乱,过多对碱基突变的容忍性差.就一条序列来说,将比对后延长的结果进行二次比对,以此类推,直到不能延长为止. est数据库的覆盖率超过95%. 先利用其他数据库(eg:引物数据库.末端数据库)…