转自:http://blog.sina.com.cn/s/blog_8088f3700101pab7.html

权威发布:长链非编码RNA命名规则

对于人类基因命名标准的制定而言,雨果基因命名委员会(HGNC)是唯一官方授权的机构。HGNC的数据库中有38000个基因名称,其中大部分是编码蛋
白基因;但HGNC也命名了8500多个人类非编码基因及假非编码基因,通过与各层次专家们的合作,他们命名了大多数的小非编码RNA。

小非编码RNA一般可根据它们的同源性及相同功能来分类。相比而言,长链非编码RNA则有其完全不同的一系列特点,它们的长度超过200个碱基,不具有保守序列的同源性,还有多变的功能属性。就像编码蛋白基因一样,长链非编码RNA也是尽量基于它们产物的已知功能来命名。

为了帮助科研人员能有效地命名lncRNA,让他们的命名更规范,名字更能反映功能,HGNC制作了这么一个命名指导标准,供科研人员参考。

在一个长链非编码RNA要发表之前,研究人员应先得到HGNC的认可。

依据相关预测,人类基因组中有大量的长链非编码RNA(至少几千条),但人类了解其功能的很少。所以,一般用基因组上下文来对未知功能的lncRNA命
名。HGNC希望与研究者们一起把长链非编码RNA命名的工作做好。HGNC的目标是让lncRNA的命名具有唯一性、准确性(让名字最大程度的反映功
能)。

lncRNA 命名指导标准
一条lncRNA要命名得合理准确,有一些原则需要去遵循,有许多的因素需要去注意。详细的命名原则及考虑因素如下:
每一条lncRNA的名字应具有唯一性

“名字唯一性”这条原则很重要,不能违反。它能让我们在研究分析某个基因时不会产生问题(不会发生这种事情:一条基因几个名字,存在重名的基
因等)。另一方面,上述问题也不利于HGNC对命名规则的管理及维护。如果一个作者发布一个lncRNA名字,而它已经在别的地方使用过,HGNC将会指
定一个新的名字供选择。例如,一个新的lncRNA,它的功能是维持上皮细胞在非分化状态,本来打算命名为ANCR,但是这个名字已经被使用于“快乐木偶
综合症染色体区,Angelman
syndrome chromosome region”,所以与作者达成一致,用DANCR来命名这个lncRNA“
differentiation antagonizing non-protein coding RNA”.

lncRNA的名字应是描述基因的缩写
每条lncRNA的标识都应是一个描述该基因的“缩写”或者“首字母简写”。
例如BANCR就是由‘BRAF-activated non-protein coding
RNA’短语的首字母排列而成。这样让人们容易理解名字的含义。

lncRNA的名字应仅由拉丁字母和阿拉伯数字组成
每条lncRNA的标识中不应出现标点符号,但可以用字母或者数字来代替标点符号。
连字符仅在特殊场合使用。例如:反义编码蛋白基因可在标识中加连字符(BACE1-AS就是BACE1 antisense
RNA的名字)。

lncRNA的名字中的字母应为大写
为了与其它种类物种的基因区别开来(如啮齿动物基因的标识只要求首字母大写,其余小写),人类基因标识中的字母都应为大写。
例如“热气”(HOTAIR)基因,在人类中叫HOTAIR,而在老鼠中写成Hotair。

lncRNA的名字中不应涉及具体的物种类型
例如:如果基因名字中有H/h(代表人类),由于牵涉到同源基因的问题,就会造成一些疑惑和误导。

lncRNA的标识应避免采用一些常用的词汇
基因的名字中出现的常用词汇会带来一些混乱,给分析研究带来很多问题,因此,在命名中应避免出现常见词汇。
例如:“AIRN”基因最初公布时叫‘AIR’,从公共数据库中搜索可得到22万条不相关的信息,而搜索“AIRN”则只有10条信息。可见“AIRN”的搜索效率有效得多。同样的例子很多。

lncRNA的标识应尽可能的反映其功能
例如:'XIST'基因是'X (inactive)-specific
transcript'的缩写,该基因的作用是参与沉默一对X染色体的转录。
命名的时候尽量反映基因通常的功能,而不体现其突变表型。基因的命名应简洁明了,不应包含太多信息。

  • 基因的标识中不应具有攻击或轻蔑的色彩。
  • 基因的标识中不应具有个人及地方色彩。
  • 基因的标识中不应含有神化,虚构或历史人物的名字。
  • 基因的标识中不应含有“臆想”和没什么意义的信息。

功能性转录假基因应包含它们假基因的名字
目前,一些数量较少的转录假基因被发现具有功能性,例如PTENP1基因就与“PTEN-targeting”miRNA结合一起参与调节PTEN的表达水平。

具有功能的转录假基因在命名时应保留它们的假基因名称,并且不应改变其基于功能的名称。为了方便搜索,这个功能应加在标识的最后。PTENP1的命名就是这方面的例子。PTENP1
是‘phosphatase and tensin homolog pseudogene 1 (functional)’.

如何命名未知功能的基因应遵循如下要求
未知功能的lncRNA应依据基因组上下文来命名,图一中给出如何系统化的命名的规则。

图一

如果有一个很接近的蛋白编码基因,lncRNA的名字应该以这个编码基因名字开始,然后制定以后后缀,这个后缀可以下方式分类:

反义
(antisense,AS),BACE1-AS;
内含子(intronic,IT),例如,SPRY4-IT1;
重叠
(overlapping,OT),例如,OSX2-OT;
长链基因间lncRNA(Long
intergenic
lncRNAs,lincRNAs),以LINC为前缀,数字为后缀,例如LINC00485.
本质上以上命名原则是以GNECODE的注释目录为基准,
反义RNA,正义内含子,正义重叠和长链基因间非编码RNA(lincRNA).一些新的分类方法也应该考虑,特别对这些lnRNA,它们与编码基因是头
碰头(head
to head),因此推断它们拥有双向启动子,HGNC推荐命名这些lncRNA为反义上游(Antisense
upstream,AU),例如,GENE2-AU1。大家也应该注意到HGNC并不赞成以剪接变异体来命名,所以两个剪接变异体命名是以其中一个
lncRNA基因来命名,例如,GENE2-AS1;如果一个lncRNA基因编码的转录本跨多于一个蛋白编码基因,用lncRNA的5’末端的第一个蛋
白编码基因来命名,例如GENE-AS2

上述命名的基本架构适用于大多数lncRNA,但对于基因密集区域的lncRNA可能就不适用了,这种情况下,你应该与HGNC沟通来解决。

HGNC致力于让人类基因组中lncRNA的命名有效、规范。想了解更多相关内容请访问
http://www.genenames.org/rna/LNCRNA,也可以给HGNC发邮件hgnc@genenames.org

权威发布:长链非编码RNA命名规则的更多相关文章

  1. 长链非编码RNA(lncRNA)

    长链非编码RNA(lncRNA) 转自:http://blog.sina.com.cn/s/blog_909da11301010bkz.html     长链非编码RNA(lncRNA)是一类转录本长 ...

  2. TCGA系列--TCGA长链非编码RNA的可视化工具TANRIC

    http://ibl.mdanderson.org/tanric/_design/basic/index.html

  3. 非编码RNA

    生命的基本过程是从DNA转录成mRNA,再翻译成蛋白质发挥功能.DNA就像一张绝密的密码图,不能随意被移动,只能被锁在细胞核里.要想知道这些密码,只能像复印一样,将密码图复印到mRNA上,由它们把这些 ...

  4. HDU4514(非连通图的环判断与图中最长链)

    题目:设计风景线 题意:给定一个无向图,图可能是非连通的,如果图中存在环,就输出YES,否则就输出图中最长链的长度. 分析:首先我们得考虑这是一个无向图,而且有可能是非连通的,那么就不能直接像求树那样 ...

  5. C# 编码规范、命名规则

    1  规范目的 ……………………………………………………… 3 2  适用范围 ……………………………………………………… 3 3  代码注释 ……………………………………………………… 3 3.1  ...

  6. java入门---基础语法&基础常识&编码规范&命名规范

        一个Java程序可以认为是一系列对象的集合,而这些对象通过调用彼此的方法来协同工作.下面简要介绍下类.对象.方法和实例变量的概念. 对象:对象是类的一个实例,有状态和行为.例如,一条狗是一个对 ...

  7. BZOJ.1758.[WC2010]重建计划(分数规划 点分治 单调队列/长链剖分 线段树)

    题目链接 BZOJ 洛谷 点分治 单调队列: 二分答案,然后判断是否存在一条长度在\([L,R]\)的路径满足权值和非负.可以点分治. 对于(距当前根节点)深度为\(d\)的一条路径,可以用其它子树深 ...

  8. ios开发之--编码及命名规范

    做了几年的开发工作,因为是半路出的家,所以对这块一直都没怎么重视,所以在工作中,出现了很多的尴尬场景,编码和命名的规范是一定得有的,最起码一个团队之间的规范也是很有必要的.面向对象的编程,其实很好理解 ...

  9. 「WC2010」重建计划(长链剖分/点分治)

    「WC2010」重建计划(长链剖分/点分治) 题目描述 有一棵大小为 \(n\) 的树,给定 \(L, R\) ,要求找到一条长度在 \([L, R]\) 的路径,并且路径上边权的平均值最大 \(1 ...

随机推荐

  1. 【crunch bang】程序中文化

    在应用程序中配置使用中文显示. # apt-get install locales # dpkg-reconfigure locales 安装文泉驿-微米黑字体: sudo apt-get insta ...

  2. 帮初学者改代码——playerc之“练习:求完数问题”(下)

    前文链接:帮初学者改代码——playerc之“练习:求完数问题”(上) 再来看看be_ferfect()应该如何改. be_ferfect()函数的功能是判断number是否为完数,同时把因子对写入d ...

  3. Java中的get()和set()方法

    对于JAVA初学者来说,set和get这两个方法似乎已经很熟悉了,这两个方法是JAVA变成中的基本用法,也是出现频率相当高的两个方法. 如果你对于这两个方法还有困惑甚至完全不知道这两个方法是做什么的, ...

  4. HGE引擎之hgeSprite

    一.hgeSprite类 hgeSprite是一个精灵实体的HGE帮助类. 1.构造函数 创建和初始化一个hgeSprite对象. hgeSprite(HTEXTURE tex, float x, f ...

  5. java IO复习笔记

    1. IO是什么? Input Output Java的核心库java.io提供了全面的IO接口.包括:文件读写.标准设备输出等.Java中IO是以流为基础进行输入输出的,所有数据被串行化写入输出流, ...

  6. java中==与equal()方法的区别

    ==比较的是对象的地址,也就是是否是同一个对象: equal比较的是对象的值. Integer r1 = new Integer(900);//定义r1整型对象Integer r2 = new Int ...

  7. Android 常用工具类之 DimenUtil

    public class DimenUtil { /** sp转换成px */ public static int sp2px(float spValue) { float fontScale = M ...

  8. Java的深度克隆和浅度克隆

    说到克隆,其实是个比较简单的概念,跟现实生活正的克隆一样,复制一个一模一样的对象出来.clone()这个方法是从Object继承下来的,一个对象要实现克隆,需要实现一个叫做Cloneable的接口,这 ...

  9. libsqlite3.dylib找不到

    Xcode7中 Link Binary With Libraries 没有 .dylib库,只能找到对应的 .tbd,但不能代替使用,通过查找资料,尝试后得到以下两种解决方法. 方法1. (heqin ...

  10. ecshop编辑器fckeditor换百度ueditor编辑器教程

    1.下载uediter编辑器,解压上传目录uediter到根目录/includes/下   2.修改admin/includes/lib_main.php         /**   * 生成编辑器  ...