shapeit最大的功能是对双链DNA进行phase和基因型进行impute。除此之外,还能提取SNP和样本,同样的,也能去除SNP和样本。下面简单介绍这两个功能。

一、提取SNP

提取SNP用到“--include-snp”参数,具体命令为:

time shapeit \

 -convert \

        --input-haps data.phased \

        --output-haps data.phased.subset \

        --include-snp include_marker.site

  

其中,include_marker.site为我们需要提取的SNP位点的位置,其格式如下:

20158887

21111456

45612378

每一个位点一行

 

二、去除SNP

去除SNP用到“--exclude-snp”参数,具体命令为:

time shapeit \

 -convert \

        --input-haps data.phased \

        --output-haps data.phased.subset \

        --exclude-snp exclude_marker.site

  

其中,exclude_marker.site为我们需要去除的SNP位点的位置,其格式如下:

20158887

21111456

45612378

每一个位点一行

 

三、提取样本

提取样本用到的参数为“--include-ind”,具体命令为:

time shapeit \

 -convert \

        --input-haps data.phased \

        --output-haps data.phased.subset \

        --include-snp include_ind.ind

  

include_ind.ind的文件为我们需要提取的样本ID,一个样本一行,如下:

NA12056

NA25034

NA75213

 

四、去除样本

去除样本用到的参数为“--exclude-ind”,具体命令为:

time shapeit \

 -convert \

        --input-haps data.phased \

        --output-haps data.phased.subset \

        --exclude-snp exclude_ind.ind

  


exclude_ind.ind的文件为我们需要去除样本的ID,一个样本一行,如下:

NA12056

NA25034

NA75213

参考链接:

1、https://mathgen.stats.ox.ac.uk/genetics_software/shapeit/shapeit.html#input

2、https://jmarchini.org/shapeit-3-usage/

shapeit提取或去除指定SNP和样本(shapeit extract or exclude SNP, sample)的更多相关文章

  1. Ztree _ 横向显示子节点、点击文字勾选、去除指定元素input的勾选状态

    前些天项目需要树结构表现数据,需求ztree就能满足所以直接使用ztree只是踩了些小坑... 1.ztree子节点横向显示(下图): 效果说明:第三级子节点按需求横向显示其他竖向显示,每行最多显示5 ...

  2. PHP二维数组--去除指定列含有重复项的数组

    给定二维数组: $arr = array( '0' => array('张三',2,3,4), '1' => array('李四',2,3,4), '2' => array('张三' ...

  3. 去除指定….RemoveMatching…(Power Query 之 M 语言)

    表去除指定行: =Table.RemoveMatchingRows( 表, 列表, "指定列") 表中指定列中与列表中相同的行会被去除 表只有一列时,第三参数可以缺省 示例1:&q ...

  4. OpenCV代码提取:遍历指定目录下指定文件的实现

    前言 OpenCV 3.1之前的版本,在contrib目录下有提供遍历文件的函数,用起来比较方便.但是在最新的OpenCV 3.1版本给去除掉了.为了以后使用方便,这里将OpenCV 2.4.9中相关 ...

  5. python提取mysql中指定列参数,并循环打印

    试验环境: Python 3.7.0 Mysql 5.0 实验目的: 使用python将数据库中指定的列中的数值取出来,并循环遍历,用以当成参数传递给需要它的方法. 本次实验取的是para列的数据 实 ...

  6. xml去除指定节点,保留子节点操作

    现有xml文件: <?xml version="1.0" encoding="utf-8" ?> <ShiftConfig xmlns:xsi ...

  7. opencv —— inpaint 图像修补、去除指定区域物体

    实现图像修补.物体去除:inpaint 函数 void inpaint(InputArray src, InputArray inpaintMask, OutputArray dst, double ...

  8. 【R】表达矩阵指定绘制两样本的相关性散点图?

    表达矩阵 要做两两样本的相关性散点图,并计算标明相关系数. 编写函数要点: 直接在aes中传参是不行的 线性回归表达式 函数 方法1:用!!ensym myplot <- function(in ...

  9. python正则表达式替换或去除指定字符

    代码: import re regEx = "[\n""|]" # 去除字符串中的换行符.中文冒号.|,需要去除什么字符就在里面写什么字符 str= re.su ...

随机推荐

  1. 18-10-31 Scrum Meeting 3

    1.会议照片 2.每人的工作 昨天完成的工作   1 制定配置 修改配置 查询配置这三个接口   2 3 获取单词对应的中文释义   4 完成测验的部分接口   5 后端对接计划的接口   6 剩余的 ...

  2. 一文把samba相关的都说清楚

    1.前言 samba源码都一样,配置也也一样,各个不同linux版本,唯一不同的是对服务的启动方式不同.下面以ubuntu14.4为例,说明. 2. 安装samba samba的安装,可以源码安装,大 ...

  3. Hive的命名空间

    Hive的命名空间分为:hiveconf , system, env 和 hivevar 1.hiveconf 的命名空间指的是hive-site.xml下面配置的环境变量 2.system的命名空间 ...

  4. 010 Editor v8.0.1(32 - bit) 算法逆向分析、注册机编写

    010 Editor 的逆向分析整体算下来还是比较简单的,将程序拖入OD,通过字符串搜索定位到核心代码,经过分析,主要是如下图所示的两个关键函数,返回正确的值,才算是注册成功. 00409C9B 这个 ...

  5. Filebeat插件启动失败,不能直接查找报错原因

    老是在filebeat启动的这一步骤上出错,但是由于filebeat是由systemd启动的,因此原因也经常查不清楚,因此并不能直观的查出错误在哪里,所以今天教给大家两个寻找错误的根源的方法 先看我这 ...

  6. LinuxCPU性能监控工具---mpstat

    mpstat是 Multiprocessor Statistics的缩写,是实时系统监控工具.其报告与CPU的一些统计信息,这些信息存放在/proc/stat文件中.在多CPU系统里,其不但能查看所有 ...

  7. C语言----int (*p)[4] ---思考总结

    a+1  跳4个int (*a)+1 跳一个int

  8. bsp makefile2

    1. grep "bsp_dir" -r ./  -s  --exclude-dir "*.git" 用这个加快目录定位-- 2.编译所有子目录 for dir ...

  9. JetBrains 全套激活 Pycharm Clion 高校学生老师免费用

    https://www.jetbrains.com/store/?fromMenu#edition=discounts https://www.jetbrains.com/zh/student/ 用高 ...

  10. 使用 Linux 文件恢复工具

    使用 Linux 文件恢复工具         Linux 文件恢复的原理 inode 和 block 首先简单介绍一下 Linux 文件系统的最基本单元:inode.inode 译成中文就是索引节点 ...