【转】Fst指数

转载自 http://blog.csdn.net/zhu_si_tao/article/details/71513099
与 http://blog.sina.com.cn/s/blog_4ab0b3390102viol.html

群体遗传学--Fst指数,即群体间分化指数,用于群体间分化分析。

群体遗传学中衡量群体间分化程度的指标有很多种,最常用的就是Fst指数。Fst指数,由F统计量演变而来。F统计量(FIS,FIT,FST)主要有三种。Fst是针对一对等位基因,如果基因座上存在复等位基因,则需要用Gst衡量,基因差异分化系数(gene differentiation coefficient,Gst)。
 
假定有s个地方群体,第k个地方群体相对大小(占比)为wk。在一个基因座上,第k个地方群体中第i个等位基因频率为qk(i),杂合体频率观察值为hk。那么整个群体中观察到的杂合体频率平均值HI,地方群体为理想群体的期望杂合体频率平均值HS,整个群体为理想群体的期望杂合体频率HT,分别为:
FIS,是HI相对于HS减少量的比值,即地方群体的平均近交系数。
FST,是HS相对于HT减少量的比值,即有亲缘关系地方群体间的平均近交系数。
其中,HS:地方群体为理想群体的期望杂合体频率平均值   HT:整个群体为理想群体的期望杂合体频率
FIT,是HI相对于HT减少量的比值,即整个群体的平均近交系数。
可见,三者在数量上的关系为:
从配子间亲缘关系角度分析,FST和FIT分别相当于地方群体和整个群体中携带的一对等位基因是同源的概率,而FST是从两个地方群体中任意抽取的两个配子是同源的概率。从两个地方群体中任意抽取的两个配子是同源的概率大,表明两个地方群体的遗传组成相似,分化程度低;反义,分化程度高。
 
FST取值范围[0,1],最大值为1,表明等位基因在各地方群体中固定,完全分化;
最小值为0,意味着不同地方群体遗传结构完全一致,群体间没有分化。
 
Fst(Fixation index)通常用来衡量population之间的genetic distance。1说明两个population是完全独立的。0说明两个population之间自由interbreeding。Fst值越大,说明genetic distance越远。值越低,说明大多数的genetic variation是发生在同一个population的。
 
Wright建议,实际研究中,FST为0~0.05:群体间遗传分化很小,可以不考虑;
FST为0.05~0.15,群体间存在中等程度的遗传分化;
FST为0.15~0.25,群体间遗传分化较大;
FST为0.25以上,群体间有很大的遗传分化。

Pi主要用来衡量每个site的nucleotide divergency。

这几个参数同样可以通过vcftools来计算:

vcftools:

vcftools --vcf test.vcf  --window-pi 3000  --out Tenera

vcftools --vcf test.vcf  --TajimaD 3000  --out Tenera

vcftools --vcf test.vcf --weir-fst-pop A2.txt --weir-fst-pop A134567.txt --fst-window-size 3000 --out A2.all.Fst

【转】Fst指数的更多相关文章

  1. Fst指数说明

    群体遗传学--Fst指数,即群体间分化指数,用于群体间分化分析. 群体遗传学中衡量群体间分化程度的指标有很多种,最常用的就是Fst指数.Fst指数,由F统计量演变而来.F统计量(FIS,FIT,FST ...

  2. 使用vcftools或者gcta计算群体间固定指数(Fixation index,FST)

    下列所用到的数据均为千人基因组数据库 1.通过vcftools计算FST 命令行如下: ./vcftools --vcf input_data.vcf --weir-fst-pop populatio ...

  3. [LeetCode] H-Index 求H指数

    Given an array of citations (each citation is a non-negative integer) of a researcher, write a funct ...

  4. UVA 10692 Huge Mods(指数循环节)

    指数循环节,由于a ^x = a ^(x % m + phi(m)) (mod m)仅在x >= phi(m)时成立,故应注意要判断 //by:Gavin http://www.cnblogs. ...

  5. 股指的趋势持续研究(Hurst指数)

    只贴基本的适合小白的Matlab实现代码,深入的研究除了需要改进算法,我建议好好研究一下混沌与分形,不说让你抓住趋势,至少不会大亏,这个资金盈亏回调我以前研究过. function [line_H,R ...

  6. 使用excel计算指数平滑和移动平均

      指数平滑法 原数数据如下: 点击数据——数据分析 选择指数平滑 最一次平滑 由于我们选择的区域是B1:B22,第一个单元格“钢产量”,被当做标志,所以我们应该勾选标志.当我们勾选了标志后,列中的第 ...

  7. 快速得出e指数的算法

    , b, c = , d, e = , f[]; int main() { for (;b - c;) f[b++] = gap; , c;c-=, printf("%.4d ", ...

  8. 决策树-预测隐形眼镜类型 (ID3算法,C4.5算法,CART算法,GINI指数,剪枝,随机森林)

    1. 1.问题的引入 2.一个实例 3.基本概念 4.ID3 5.C4.5 6.CART 7.随机森林 2. 我们应该设计什么的算法,使得计算机对贷款申请人员的申请信息自动进行分类,以决定能否贷款? ...

  9. 关于jquery on方法进行事件绑定触发次数指数叠加的问题

    发生环境: $modal.on('click', '#search',function(e){}); 上面代码的语法是这样的: .on( events [, selector ] [, data ], ...

随机推荐

  1. SPFA--P3905 道路重建

    题目描述 从前,在一个王国中,在n个城市间有m条道路连接,而且任意两个城市之间至多有一条道路直接相连.在经过一次严重的战争之后,有d条道路被破坏了.国王想要修复国家的道路系统,现在有两个重要城市A和B ...

  2. Android群英传知识点回顾——第十章:Android性能优化

    10.1 布局优化 10.1.1 Android UI渲染机制 10.1.2 避免Overdraw 10.1.3 优化布局层级 10.1.4 避免嵌套过多无用布局 10.1.5 Hierarchy V ...

  3. mysql第四篇:数据操作之单表查询

    单表查询 一.简单查询 -- 创建表 DROP TABLE IF EXISTS `person`; CREATE TABLE `person` ( `id` ) NOT NULL AUTO_INCRE ...

  4. [转]Linux命令行上传文件到 百度网盘 bypy

    安装软件工具: apt-get install python-pip pip install requests pip install bypy 授权登陆: 执行 bypy info,显示下边信息,根 ...

  5. Filter过滤器技术详解

    前言 有这样一个常见的开发场景,我们编写一套系统,或者分析一套系统如何实现的过程中,我们肯定会发现这套系统的拦截机制.比如说京东或者淘宝之类的,存在这种拦截机制,这套拦截机制能够过滤掉哪些错误的登录注 ...

  6. 自己编写DLL并导出函数

    sub.c #include<windows.h> #include"sub.h" int WINAPI DllMain(_In_ HANDLE _HDllHandle ...

  7. oracle 向表中插入BLOB类型数据

    提示: 待插入图片必须保存到oracle主机路径上. 步骤: 1.SYSDBA权限用户创建图片所在目录 CREATE OR REPLACE DIRECTORY TEST_DIR AS 'C:\Pict ...

  8. VMware-Workstation-Full-12.5.9

    https://download3.vmware.com/software/wkst/file/VMware-Workstation-Full-12.5.9-7535481.x86_64.bundle ...

  9. 寒假day13

    今天看了计算机网络的相关面试题

  10. Django2.0——中间件

    Django中间件middleware本质是一个类,在请求到返回的中间,类中不同的方法会在指定的时机中被触发.setting.py的变量MIDDLEWARE_CLASSES中的每一个元素都是中间件,且 ...