GFF3格式文件

GFF3是GFF注释文件的新标准。文件中每一行为基因组的一个属性，分为9列，以TAB分开。

依次是：

1. reference sequence：参照序列

指出注释的对象。如一个染色体，克隆或片段。可以有多个参照序列。

该id的取名不能以’>’开头，不能包含空格。

2. source ：来源

注释的来源。如果未知，则用点（.）代替。

3. type ：类型

属性的类型。建议使用符合SO惯例的名称（sequence ontology，参看[[Sequence Ontology Project]]) ,如gene，repeat_region，exon，CDS等。

4. start position ：起点

属性对应片段的起点。从1开始计数。

5. end position ：终点

属性对应片段的终点。一般比起点的数值要大。

6. score ：得分

对于一些可以量化的属性，可以在此设置一个数值以表示程度的不同。如果为空，用点（.）代替。

7. strand ：链

“＋”表示正链，“－”表示负链，“.”表示不需要指定正负链。

8. phase ：步进

对于编码蛋白质的CDS来说，本列指定下一个密码子开始的位置。可以是0，1或2，表示到达下一个密码子需要跳过的碱基个数。

对于其它属性，则用点（.）代替。

9. attributes ：属性

一个包含众多属性的列表。格式为“标签＝值”（tag=value）。不同属性之间以分号相隔。可以存在空格，不过若有“,=;”则用URL转义（URL escaping rule），同时TAB也需要转换为“ ”表示。所有以大写字幕开头的标签被保留，用于大众认可的用途，而以小写字母开头的标签则根据自己安排随意应用。

下列的标签已定义：

指定一个唯一的标识。对属性分类是非常好用（例如查找一个转录单位中所以的外显子）。

Name

指定属性的名称。展示给用户的就是该属性。。Name的值在可视化的时候得到展示。因此，Name可以根据自己展示的需要随意取值。

Alias

名称的代称或其它。当存在其它名称时使用该属性。

Parent

指明feature所从属的上一级ID。用于将exons聚集成transcript，将transripts聚集成gene。

Target

指明比对的目标区域，一般用于表明序列的比对结果。格式为”target_id start end [strand]“,其中strand是可选的(“+”或”-”), target_id中如果包含空格，则要转换成’ ′。

Gap

比对结果的gap信息，和Target一起，用于表明序列的比对结果。

Note

描述性的一些说明。

Is_circular

表明featrue是否为环化的。用于环状基因组序列。

同一个tag如果有多个值，则多个值之间使用逗号隔开，比如：

Parent=AF2312,AB2812,abc-3

Alias=M19211,gna-12,GAMMA-GLOBULIN

能够使用多个值的tag有：Parent, Alias, Note, Dbxref and Ontology_term。

参考：http://blog.sina.com.cn/s/blog_670445240102uxh2.html

GFF3格式文件的更多相关文章

(转) gffcompare和gffread | gtf | gff3 格式文件的分析 | gtf处理 | gtfparse
工具推荐:https://github.com/openvax/gtfparse 真不敢相信,Linux自带的命令会这么强大,从gtf中提取出需要的transcript,看起来复杂,其实一个grep就 ...
GFF3格式
GFF3是GFF注释文件的新标准.文件中每一行为基因组的一个属性,分为9列,以TAB分开. 依次是: 1. reference sequence:参照序列指出注释的对象.如一个染色体,克隆或片段.可 ...
【NLP】Tika 文本预处理：抽取各种格式文件内容
Tika常见格式文件抽取内容并做预处理作者白宁超 2016年3月30日18:57:08 摘要:本文主要针对自然语言处理(NLP)过程中,重要基础部分抽取文本内容的预处理.首先我们要意识到预处理的重 ...
Mac新建文件夹、txt文件、无格式文件
新建文件夹: mkdir test 新建txt touch test.txt 新建无后缀格式文件 touch test 如果要删除文件夹 rm -r -f test
针对格式文件，Python读取一定大小的文件内容
由数据库导出的数据是格式化数据,如下所示,每两个<REC>之间的数据是一个记录的所有字段数据,如<TITLE>.<ABSTRACT>.<SUBJECT_COD ...
报表开发导出各种格式文件的API
文件输出的多样性,准确性和稳定性对于我们常用的报表软件来说很重要.报表的输入是指从报表的模板文件(XML格式的)创建WorkBook对象,输出则指将报表保存为各种格式文件,比如Pdf.Excel.Wo ...
2013xlsm格式文件处理
2013xlsm格式文件处理 2013格式的xlsm文件在低版本打开为空白的处理 1.关闭2013的宏2.打开文件,另存(去打开密码)3.2007打开另存(格式已变为2007)4.仅破解VBA密码5. ...
Servlet 实现上传文件以及同时，写入xml格式文件和上传
package com.isoftstone.eply.servlet; import java.io.BufferedReader; import java.io.BufferedWriter; i ...
[OSG][转]osg格式文件
转自:http://blog.csdn.net/timothyfly/article/details/7826139 osg格式文件中如何处理多个节点共享一个子节点下面一段程序中,共有三个Group ...

随机推荐

00 Cadence学习总目录
这个系列是我学习于博士CADENCE视频教程60讲时,一边学一边记的笔记.使用的CADENCE16.6. 01-03课了解软件创建工程创建元件库分裂元件的制作方法 04课正确使用hetero ...
杂项之使用qq邮箱发送邮件
杂项之使用qq邮箱发送邮件本节内容特殊设置测试代码 1. 特殊设置之前QQ邮箱直接可以通过smtp协议发送邮件,不需要进行一些特殊的设置,但是最近使用QQ邮箱测试的时候发现以前使用的办法无法奏 ...
javascript的ajax
AJAX 一 AJAX预备知识:json进阶 1.1 什么是JSON? JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式.JSON是用字符串来表示Javas ...
强大的支持多文件上传的jQuery文件上传插件Uploadify
支持多文件上传的jQuery文件上传插件Uploadify,目前此插件有两种版本即Flash版本和HTML5版本,对于HTML5版本会比较好的支持手机浏览器,避免苹果手机Safari浏览器不支持Fla ...
提高前端开发效率必备AngularJS （基础）
简介 AngularJS 是一个为动态WEB应用设计的结构框架,提供给大家一种新的开发应用方式,这种方式可以让你扩展HTML的语法,以弥补在构建动态WEB应用时静态文本的不足,从而在web应用程序中使 ...
Redux原理（一）：Store实现分析
写在前面写React也有段时间了,一直也是用Redux管理数据流,最近正好有时间分析下源码,一方面希望对Redux有一些理论上的认识:另一方面也学习下框架编程的思维方式. Redux如何管理stat ...
PDF.NET内存数据库的使用小结
深蓝医生的PDF.NET数据开发框架提供了一个建议的内存数据库功能,具体的功能介绍我就不多说了,可以看医生的博文<移花接木:当泛型方法遇上抽象类----我的“内存数据库”诞生记>. 我之所 ...
在SpringMVC中使用@SessionAttributes和@ModelAttribute将数据存储在session域中
今天在我的springMVC项目--图书管理系统中,希望在登录时将登录的Users存在session中,开始是准备在controller中使用Servlet API中的对象,可是一直无法引用,不知道为 ...
MVC中得到成员元数据的Description特性描述信息公用方法
#region 从类型成员获取指定的Attribute T特性集合 /// <summary> /// 从类型成员获取指定的Attribute T特性集合 /// </summary ...
常用js归纳
一.获取地址栏参数 /*根据name获取URL参数*/ function getQueryString(name) { var reg = new RegExp("(^|&)&quo ...

GFF3格式文件

GFF3格式文件的更多相关文章

随机推荐

热门专题