Vcf文件格式】的更多相关文章

Vcf文件格式是GATK钟爱的表示遗传变异的一种文件格式. 就拿GATK给出的vcf例子说明吧,下面这个文件只表示了一个完整vcf文件的前几个SNP. 看上去确实有点复杂,那就把它分为两部分看吧,第一部分把他归为说明文件,就是每一列最前面有2个#符号的那些列所提到的就是为了解释下面“正文”INFO列中可能要出现的一些tags和和FORMAT列中对基因型的表示.第二部分可以归为下面的内容: #CHROM  POS ID      REF ALT QUAL    FILTER  INFO    FO…
前言   处理vcf文件的时候,需要多种切割,正则匹配,如果要自己写其实会比较麻烦,并且每次还得根据vcf文件格式或者需要读取的值不同要修改相应的代码.因此很多人会选择一些python的vcf的库,但是首先你得安装这个库, 并且有一些库它固定了能够读的内容,如果你的vcf的信息不在它固定的里面,就读不出来.比如最近我想读一个样本的AF,但是它放在最后样本的GT那列,不在INFO那一列,有一些库竟然无能为力.   因此我写了这个通用的读vcf的类,直接复制粘贴这部分代码就可以方便的用这个类进行vc…
转载:http://blog.sina.com.cn/s/blog_6721167201018fyw.html GATK (全称The Genome Analysis Toolkit)是Broad Institute开发的用于二代重测序数据分析的一款软件,里面包含了很多有用的工具. 网址:http://www.broadinstitute.org/gsa/wiki/index.php/Home_Page 前段时间刚发布了2.x版本的,最近几天都在不断更新,网址也搬迁到 http://www.br…
1,jbrowse 是什么东西 ? JBrowse is a genome browser with a fully dynamic AJAX interface, being developed as the eventual successor to GBrowse. It is very fast and scales well to large datasets. JBrowse is javascript-based and does almost all of its work di…
1.下载安装bedtools: 2.生成bed文件:标准的bed文件格式如下: chr7 127471196 127472363 Pos1 0 + 127471196 127472363 255,0,0 chr7 127472363 127473530 Pos2 0 + 127472363 127473530 255,0,0 chr7 127473530 127474697 Pos3 0 + 127473530 127474697 255,0,0 chr7 127474697 127475864…
参考资料 通讯录导入导出vcf格式文件方法可参考: https://qiaodahai.com/android-iphone-mobile-phones-contacts-import-and-export.htmlvCard维基百科:https://en.wikipedia.org/wiki/VCardvCard Format Specification:https://www.rfc-editor.org/rfc/pdfrfc/rfc6350.txt.pdf 手动导出实例 Android(A…
1. SAM格式说明 SAM代表Sequence Alignment/Map格式,是一种制表符分隔的文本格式,包含一个可选的头部分(header section,有人称之为“注释部分”),和一个比对部分(alignment section).如果包含头部分,那么头部分必须置于比对部分之前.头部分的行以@符号开头,而比对部分的行不以@符号开头.比对部分的每一行包含11个必选的字段,用于说明重要的比对信息,如比对位置(mapping position)等:另有可变数量的可选字段,用于存储其他信息(f…
目录 需求 示例文件 代码实现 补充说明 需求 客户的一个简单需求: 我有一批功能基因位点,想从重测序的群体材料中找到这些位点,如何批量快速获得? 示例文件 gene.txt test.vcf 代码实现 run.sh cat $1 |while read gene chr from to do #echo $chr $from $to if echo $2 |grep -q '.*.vcf.gz$';then vcftools --gzvcf $2 --chr $chr --from-bp $f…
RIFF file format RIFF全称为资源互换文件格式(Resources Interchange File Format),是Windows下大部分多媒体文件遵循的一种文件结构.RIFF文件所包含的数据类型由该文件的扩展名来标识,能以RIFF格式存储的数据有: 音频视频交错格式数据 .AVI 波形格式数据 .WAV 位图数据格式 .RDI MIDI格式数据 .RMI 调色板格式 .PAL 多媒体电影 .RMN 动画光标 .ANI 其他的RIFF文件 .BND CHUNK chunk是…
Properties文件格式说明 Properties继承自Hashtable,是由一组key-value的集合. 在Java中,常用properties文件作为配置文件.它的格式是什么样的呢? 下图是一个用于展示格式的properties文件 下面是测试结果: properties文件的书写要求总结: 1.注释内容由 # 或者! 开头 2.key,value之间用 = 或者 : 分隔.一行中既有=也有:时,第一个(或者=或者:)将作为key,value分隔符. 3.key 不能换行,value…