在 KEGG 数据库中,把功能相似的蛋白质归为同一组,然后标上 KO 号.通过相似性比对,可以为未知功能的蛋白序列注释上 KO 号. 截止到 2015 年 6 月 12 日,KEGG 数据库中共收录了 3,904 个完整的基因组.其中 304 个为真核生物,3,600 个为原核生物.在真核生物中,共有 299 个物种(一个物种可能不止一个基因组),分为 172 科,227 属:在原核生物中,共有 1,858 个物种,分为 809 属. KEGG 对这些物种的基因序列构成了一个非冗余的 KEGG…