circos pipeline

# /usr/bin/env python
# coding=utf-8
###################################
#  Author : yunkeli
#  Version : 1.0(2015/6/20)
#  E-mail : 1316014512@qq.com
###################################
import os
import argparse
import re
import random
def vcf_SNPdensity(snpvcffile,pathway):
   print "this step is vcf to SNPdensity "
   cmdvcftorate = "/home/liyunke/vcftools_0.1.12b/bin/vcftools --vcf "+snpvcffile+" --out " + pathway+"/SNPdensity100K --SNPdensity 1000000"
   result_analysis=os.popen(cmdvcftorate)
   print result_analysis.read()
def density(SNPdensityfile,pathway):
   print "##############################"
   print "this step is vcf to densitysplit cat "
   fileopen = open(SNPdensityfile).readlines()[1:]
   savename = pathway+"/"+"SNPdensity50K.snpden.new.txt"
   filesave = open(savename,"w+")
   for i in fileopen:
      listi = i.split()
      filesave.write(listi[0].replace("chr","hs")+"\t"+listi[1]+"\t"+str(int(listi[1])+999999)+"\t"+str(float(listi[3])/10)+"\n")
   filesave.close()
def densitysplit(SNPdensityfile,pathway):
   print "##############################"
   print "this step is vcf to densitysplit "
   fileopen = open(SNPdensityfile).readlines()[1:]
   namelist = []
   for i in fileopen:
      if i.split()[0] not in namelist:
         namelist.append(i.split()[0])
   for j in namelist:
      savename = pathway+"/"+j.replace("chr","hs")+".snp.txt"
      filesave = open(savename,"w+")
      for x in fileopen:
         listx = x.split()
         if listx[0] == j:
            filesave.write(listx[0].replace("chr","hs")+"\t"+listx[1]+"\t"+str(int(listx[1])+499999)+"\t"+listx[3]+"\n")
      filesave.close()
   print "densitysplit ok"
def sv_split(svdensityfile,pathway):
   print "##############################"
   print "this step is vcf to sv_file split "
   fileopen = open(svdensityfile).readlines()[1:]
   namelist = []
   for i in fileopen:
      if i.split()[0] not in namelist:
         namelist.append(i.split()[0])
   for j in namelist:
      listrandom = []
      savename = pathway+"/"+j.replace("chr","hs")+".sv.txt"
      filesave = open(savename,"w+")
      for x in fileopen:
         listx = x.split()
         if listx[0] == j:
            if listx[0] != listx[5]:
               listrandom.append(x)
      if len(listrandom) > 10:
         slicelist = random.sample(listrandom, 10)
         for links in slicelist:
            listlinks = links.split()
            filesave.write("segdups"+str(listrandom.index(links))+"\t"+"\t".join(listlinks[0:3]).replace("chr","hs")+"\n")
            filesave.write("segdups"+str(listrandom.index(links))+"\t"+"\t".join(listlinks[5:8]).replace("chr","hs")+"\n")
         filesave.close()
      else:
         for links in listrandom:
            listlinks = links.split()
            filesave.write("segdups"+str(listrandom.index(links))+"\t"+"\t".join(listlinks[0:3])+"\n")
            filesave.write("segdups"+str(listrandom.index(links))+"\t"+"\t".join(listlinks[5:8])+"\n")
         filesave.close()
def circos_config(npath,prefix):
   oldconfig = "/home/liyunke/circos/sof/circos-0.67-7/work/pipeline/etc/config"
   configopen = open(oldconfig).read()
   f1 = re.sub("pathway",npath,configopen)
   newconfig = "/home/liyunke/circos/sof/circos-0.67-7/work/pipeline/etc/"+prefix+".conf"
   newconfigsave = open(newconfig,"w+")
   newconfigsave.write(f1)
   newconfigsave.close()
def main():
   p = argparse.ArgumentParser(usage='./circos.pipline.py [--vcf] [--sv] [--prefix] [--outdir] ', description='circos snp sv')  
   p.add_argument('-v','--vcf', type=str, help='vcf file')  
   p.add_argument('-s','--sv',  type=str, help='sv file')
   p.add_argument('-p','--prefix', default="circostest",help='prefix or usrname')
   p.add_argument('-o','--outdir', default="./", help='document directory')
   args = p.parse_args()
   prefix = args.prefix
   vcffile = args.vcf
   outdir = args.outdir
   vcf_SNPdensity(vcffile,outdir)
   SNPdensityfile = outdir+"/SNPdensity100K.snpden"
   density(SNPdensityfile,outdir)
   densitysplit(SNPdensityfile,outdir)
   svdensityfile = args.sv
   sv_split(svdensityfile,outdir)
   circos_config(outdir,prefix)
   cmdstr = "/home/liyunke/circos/sof/circos-0.67-7/bin/circos  -conf /home/liyunke/circos/sof/circos-0.67-7/work/pipeline/etc/"+prefix+".conf --outputdir "+ outdir+" -outputfile "+prefix
   result_analysis_circos =os.popen(cmdstr)
   print result_analysis_circos.read()
   rmcmd = "rm "+ outdir +"/hs*"
   result_analysis_rm =os.popen(rmcmd)
   print result_analysis_rm.read()
if __name__ == '__main__':
   main()

circos pipeline的更多相关文章

redis大幅性能提升之使用管道（PipeLine）和批量（Batch）操作
前段时间在做用户画像的时候,遇到了这样的一个问题,记录某一个商品的用户购买群,刚好这种需求就可以用到Redis中的Set,key作为productID,value 就是具体的customerid集合, ...
Building the Testing Pipeline
This essay is a part of my knowledge sharing session slides which are shared for development and qua ...
Scrapy:为spider指定pipeline
当一个Scrapy项目中有多个spider去爬取多个网站时,往往需要多个pipeline,这时就需要为每个spider指定其对应的pipeline. [通过程序来运行spider],可以通过修改配置s ...
图解Netty之Pipeline、channel、Context之间的数据流向。
声明:本文为原创博文,禁止转载. 以下所绘制图形均基于Netty4.0.28版本. 一.connect(outbound类型事件) 当用户调用channel的connect时,会发起一个 ...
初识pipeline
1.pipeline的产生从一个现象说起,有一家咖啡吧生意特别好,每天来的客人络绎不绝,客人A来到柜台,客人B紧随其后,客人C排在客人B后面,客人D排在客人C后面,客人E排在客人D后面,一直排到店面 ...
MongoDB 聚合管道（Aggregation Pipeline）
管道概念 POSIX多线程的使用方式中, 有一种很重要的方式-----流水线(亦称为"管道")方式,"数据元素"流串行地被一组线程按顺序执行.它的使用架构可参考 ...
SSIS Data Flow 的 Execution Tree 和 Data Pipeline
一,Execution Tree 执行树是数据流组件(转换和适配器)基于同步关系所建立的逻辑分组,每一个分组都是一个执行树的开始和结束,也可以将执行树理解为一个缓冲区的开始和结束,即缓冲区的整个生命周 ...
Kafka到Hdfs的数据Pipeline整理
作者:Syn良子出处:http://www.cnblogs.com/cssdongl 转载请注明出处找时间总结整理了下数据从Kafka到Hdfs的一些pipeline,如下 1> Kafka ...
SQL Queries from Transactional Plugin Pipeline
Sometimes the LINQ, Query Expressions or Fetch just doesn't give you the ability to quickly query yo ...

随机推荐

Kubernetes中强制删除Pod、namespace
Kubernetes中强制删除Pod.namespace 解决方法可使用kubectl中的强制删除命令 # 删除POD kubectl delete pod PODNAME --force --gr ...
PHP设计模式之----简单工厂模式
定义个抽象的类(或接口),让子类去继承(实现)它 abstract class Operation { abstract public function getValue($num1, $num2); ...
Spring集成CXF发布WebService并在客户端调用
Spring集成CXF发布WebService 1.导入jar包因为官方下载的包里面有其他版本的sprring包,全导入会产生版本冲突,所以去掉spring的部分,然后在项目根目录下新建了一个CXF ...
Spring集成Quartz定时任务
1.导入jar包 2.配置applicationContext.xml文件  <!-- bean id="simpleJob" cla ...
Arduino+温度、湿度传感器
Arduino语言注解Arduino语言是建立在C/C++基础上的,其实也就是基础的C语言,Arduino语言只不过把AVR单片机(微控制器)相关的一些参数设置都函数化,不用我们去了解他的底层,让我们 ...
PHP filectime() 函数
定义和用法 filectime() 函数返回指定文件的上次修改时间. 该函数将检查文件的日常修改情况和 inode 修改情况.inode 修改情况是指:权限的修改.所有者的修改.用户组的修改或其他元数 ...
CI/CD：Jenkins的流水线demo入门
在敏捷开发或者devops中,Jenkins常常作为CI/CD的主选平台,而流水线(Pipeline)是CI/CD的一个常见的体现形式,通过流水线,我们可以配置一个从编译打包,部署,自动化测试,到产品 ...
关于python中的 take no arguments 的解决方法
针对第四章编写的代码出现的错误做一个总结 Traceback (most recent call last): File "H:\image\chapter4\p81_chongxie.py ...
【02python基础-函数，类】
1.函数中的全局变量与局部变量全局变量:在函数和类定义之外声明的变量.作用域为定义的模块,从定义位置开始到模块结束.全局变量降低了函数的通用性和可读性,要尽量避免全局变量的使用.全局边个两一般作为常量 ...
jar包冲突解决
背景: 新需求需要引入新jar包,引入后发现本地启动没有报错,发到测试环境提示某个bean无法创建,nested exception is java.lang.VerifyError: Bad typ ...

circos pipeline

circos pipeline的更多相关文章

随机推荐

热门专题