hg19有哪些染色体?

  1. chr1
  2. chr2
  3. chr3
  4. chr4
  5. chr5
  6. chr6
  7. chr7
  8. chr8
  9. chr9
  10. chr10
  11. chr11
  12. chr12
  13. chr13
  14. chr14
  15. chr15
  16. chr16
  17. chr17
  18. chr18
  19. chr19
  20. chr20
  21. chr21
  22. chr22
  23. chrX
  24. chrY
  25. chrM

其实还有其他“染色体”,只是我们的研究一般用不到,所以就没有合并进来。比如做同源分析,找变异什么的,还是要选好基因组。

gene_type有哪些?

  1. cat gencode.v27.annotation.gtf | grep exon | cut -f6 -d\" | grep -v "#" | sort | uniq > gene_type
  1. 3prime_overlapping_ncRNA
  2. IG_C_gene
  3. IG_C_pseudogene
  4. IG_D_gene
  5. IG_J_gene
  6. IG_J_pseudogene
  7. IG_V_gene
  8. IG_V_pseudogene
  9. IG_pseudogene
  10. MIAT_exon1
  11. MIAT_exon5_1
  12. MIAT_exon5_2
  13. MIAT_exon5_3
  14. Mt_rRNA
  15. Mt_tRNA
  16. SOX2OT_exon1
  17. SOX2OT_exon3
  18. SOX2OT_exon4
  19. TEC
  20. TR_C_gene
  21. TR_D_gene
  22. TR_J_gene
  23. TR_J_pseudogene
  24. TR_V_gene
  25. TR_V_pseudogene
  26. Xist_exon1
  27. Xist_exon4
  28. antisense_RNA
  29. bidirectional_promoter_lncRNA
  30. lincRNA
  31. macro_lncRNA
  32. miRNA
  33. misc_RNA
  34. non_coding
  35. polymorphic_pseudogene
  36. processed_pseudogene
  37. processed_transcript
  38. protein_coding
  39. pseudogene
  40. rRNA
  41. ribozyme
  42. sRNA
  43. scRNA
  44. scaRNA
  45. sense_intronic
  46. sense_overlapping
  47. snRNA
  48. snoRNA
  49. transcribed_processed_pseudogene
  50. transcribed_unitary_pseudogene
  51. transcribed_unprocessed_pseudogene
  52. translated_processed_pseudogene
  53. unitary_pseudogene
  54. unprocessed_pseudogene
  55. vaultRNA

一共多少个基因?

  1. cat gencode.v27.annotation.gtf | cut -f4 -d\; | grep -v "#" | grep -v level | sort | uniq > gene

56609  

一共多少个转录本?

  1. cat gencode.v27.annotation.gtf | cut -f2 -d\; | grep -v "#" | grep -v gene_type | sort | uniq > transcipt

200401  

一共多少个外显子?

  1. cat gencode.v27.annotation.gtf | grep -v "#" | grep exon | cut -f3-5 | sort | uniq > exon

1132357  

有多少条lncRNA

  1. cat gencode.v27.long_noncoding_RNAs.gtf | grep -v "#" | cut -f3 -d\; | grep -v gene_type | sort | uniq > lincRNA

15754

  

初步了解hg19注释文件的内容 | gtf的更多相关文章

  1. Shell命令-文件及内容处理之vi、vim

    文件及内容处理 - vi.vim 1.Linux vi/vim 所有的 Unix Like 系统都会内建 vi 文书编辑器,其他的文书编辑器则不一定会存在. 但是目前我们使用比较多的是 vim 编辑器 ...

  2. GRCh38基因组和注释文件探究

    ensembl/release91: cat Homo_sapiens.GRCh38.91.gtf | grep -v "#" | cut -f9 | cut -f1,3,6,8 ...

  3. (转) gffcompare和gffread | gtf | gff3 格式文件的分析 | gtf处理 | gtfparse

    工具推荐:https://github.com/openvax/gtfparse 真不敢相信,Linux自带的命令会这么强大,从gtf中提取出需要的transcript,看起来复杂,其实一个grep就 ...

  4. vim 删除文件全部内容

    很多时候我们需要删除脚本文件全部内容, 重新再写入新的内容,进行其他的操作: 很多时候我们对应用程序的排错需要查看日志文件,然而日志中通常有许多我们以前的应用程序产生的日志,其他的日志过多的时候,有时 ...

  5. 关于注释【code templates】,如何导入本地注释文件

    关于如何在eclipse.myeclipse导入本地注释文件 [xxx.xml]   请看操作方式 下面是code templates文件的内容 注意  把文件中的 @@@@@@@@@@@@@@@  ...

  6. Linux如何搜索查找文件里面内容

    在Linux系统当中,如何搜.索查找文件里面的内容呢? 这个应该是系统维护.管理当中遇到最常见的需求.那么下面介绍,总结一下如何搜索.查找文件当中的内容. 搜索.查找文件当中的内容,一般最常用的是gr ...

  7. PHP批量清空删除指定文件夹内容

    PHP批量清空删除指定文件夹内容: cleancache.php <?php // 清文件缓存 $dirs = array( realpath(dirname(__FILE__) . '/../ ...

  8. 合并大量txt文件的内容

    首先熟悉一个dos命令 显示文件内容命令——type命令 1.格式:type [盘符:] [路径] 文件名 2.类型:内部命令 3.功能:把指定的文件内容在屏幕上显示或打印机输出,它常用作查阅和显示文 ...

  9. 在/proc文件系统中增加一个目录hello,并在这个目录中增加一个文件world,文件的内容为hello world

    一.题目 编写一个内核模块,在/proc文件系统中增加一个目录hello,并在这个目录中增加一个文件world,文件的内容为hello world.内核版本要求2.6.18 二.实验环境 物理主机:w ...

随机推荐

  1. Bugku-CTF之web2-听说聪明的人都能找到答案

    Day1   听说聪明的人都能找到答案   http://123.206.87.240:8002/yanzhengma/  

  2. Django文件存储(二)定制存储系统

    要自己写一个存储系统,可以依照以下步骤: 1.写一个继承自django.core.files.storage.Storage的子类. from django.core.files.storage im ...

  3. 如何在Framework中读取bundle中的Res

    前因: 因为公司上架前后的原因,外围的平台层部分提前上线,而我做的功能部分需要晚一些上线,是单独的一个工程在其他仓库开发. 我的资源文件放在Bundle中.合到主工程中,资源文件不用改,直接拖进去.倒 ...

  4. Python3基础 list len 输出元素的个数

             Python : 3.7.0          OS : Ubuntu 18.04.1 LTS         IDE : PyCharm 2018.2.4       Conda ...

  5. LVM基本应用,扩展及缩减实现

    一.基本概念 如上图所示:底层PV(物理卷可能是硬盘设备,分区或RAID等),一个或多个PV组织成一个VG(卷组),卷组是不能直接格式化使用的,所以在VG之上,还需要创建LV进行格式化使用.VG在逻辑 ...

  6. bzoj1458: 士兵占领 网络流

    链接 https://www.lydsy.com/JudgeOnline/problem.php?id=1458 也可以去luogu 思路 想成倒着删去点,使得依旧满足覆盖!! 左边横,右边列,之间用 ...

  7. HIHOcoder 1449 后缀自动机三·重复旋律6

    思路 显然endpos的大小就对应了对应子串的出现次数,所以快速求出endpos的大小,然后用它更新对应子串长度(minlen[i]~maxlen[i])的答案即可 endpos的大小可以拓扑排序求出 ...

  8. wamp phpcms部署网站问题

    服务器使用自己的服务器,域名申请后通过信息服务iis管理器建网站,并将物理地址指定到wamp的www目录中的网站的根目录.这时候如果网站首页已经生成后访问域名将进入网站首页. 出现的问题: 1.导航( ...

  9. POJ 2718 Smallest Difference(最小差)

     Smallest Difference(最小差) Time Limit: 1000MS    Memory Limit: 65536K Description - 题目描述 Given a numb ...

  10. module.exports 与 exports

    module.exports 与 exports 注意:1 对于要导出的属性,可以简单直接挂到 exports 对象上2 对于类,为了直接使导出的内容作为类的构造器可以让调用者使用 new 操作符创建 ...