Genome-wide gene-environment analyses of depression and reported lifetime traumatic experiences in UK Biobank 全基因组的,基因环境分析,抑郁症和已经报道的终身创伤经历,UKBB Depression is more frequently observed among individuals exposed to traumatic events. The relationship bet…
生命组学: 泛基因组学:用于描述一个物种基因组,据细菌基因组动力学,因为细菌的基因漂移使得各个细菌之间的基因组差异很大,(单个细菌之间的基因组差异是以基因为单位的gain&loss,而人类基因组,在个体角度两个人之间基因组差异不到1%,主要是SNP,所以CRISPR/Cas9也由细菌得来),所以转而收集同一细菌物种中所有菌株中所有基因的并集. 微生物基因组可塑性是细菌基因突变的基础,可以是环境改变使得基因的得到和丢失,由于寄居在宿主上导致基因丢失,细菌与另外生物的互作导致基因组中基因的增多.最终…
参考: Hail Hail - Tutorial  windows也可以安装:Spark在Windows下的环境搭建 spark-2.2.0-bin-hadoop2.7 - Hail依赖的平台,并行处理 google cloud platform - 云平台 Broad's data cluster set-up tool 对Google cloud SDK的一个简单的wrap,方便操作. cloudtools is a small collection of command line tool…
这个时代的生信,统计遗传,不懂或不会用这个数据库就说不过去了. 看看10年GWAS里是如何定位和评价UK biobank的: For the near future, the UK Biobank is pushing the barriers further by releasing both genome-wide genotypes and rich phenotypic data on 500,000 people to the international research commun…
http://gmod.org/wiki/MAKER_Tutorial 简单好用 identify repeats, to align ESTs and proteins to the genome, and to automatically synthesize these data into feature-rich gene annotations, including alternative splicing and UTRs, as well as attributes such as…
Systematic LncRNA Classification From: http://www.arraystar.com/Services/Services_main.asp?ID=307 Analyzing the genomic context of LncRNAs can help predict their functional role. According to the relationship between LncRNAs and their associated prot…
李爱民-西安理工大学计算机科学与工程学院 ● 简介(Introduction)-> 李爱民(Aimin Li),男,湖北随州人,西安电子科学大学博士(PhD),中共党员.中国计算机学会会员,CSC访问学者,主要研究方向为生物信息学(Bioinformatics).机器学习(Machine Learning).发表学术论文30篇,其中SCI论文14篇,获发明专利1项.主审教材1部. 主持或参与科研项目20余项.高级程序员(信息产业部),软件工程师(陕西省人事厅Software Engineer),…
现在GWAS已经属于比较古老的技术了,主要是碰到严重的瓶颈了,单纯的snp与表现的关联已经不够,需要具体的生物学解释,这些snp是如何具体导致疾病的发生的. 而且,大多数病找到的都不是个别显著的snp,大多数都找到了很多的snp,而且snp都落在非编码区了,这就导致对这些snp的解读非常的困难. 目前,已经有非常傻瓜式的GWAS pipeline了,比如:A tutorial on conducting genome‐wide association studies: Quality contr…
前言 很多人问我有没有关于全基因组关联分析(GWAS)原理的书籍或者文章推荐. 其实我个人觉得,做这个分析,先从跑流程开始,再去看原理. 为什么这么说呢,因为对于初学者来说,跑流程就像一个大黑洞,学习原理就像一个小黑洞. 很多人花了好几个月的时间在看原理,一旦丢给他数据去分析,依旧束手无策. 不会跑流程,内心依旧会很恐慌.就像从来没有入门一样. 所以,我的建议是咱们先不去管原理,直接从分析入手. 等把数据跑出来了,整个流程的技能点满了,再去看看它的原理. 入门:学习GWAS的在线网站: 对于没有…
有很多概念需要明确区分: 人有23对染色体,其中22对常染色体autosome,另外一对为性染色体sex chromosome,XX为女,XY为男. 染色体区带命名:在标示一特定的带时需要包括4项:①染色体号:②臂的符号:③区号:④在该区内的带号. 1p22表示为1号染色体短臂2区2带. 等位基因其实是一个集合,在同一个locus出现得基因型互为等位基因.Aa不能叫等位基因,正确的逻辑是:A和a是一组等位基因.由等位基因可以定义纯合和杂合. 二倍体与多倍体细胞的某些染色体上,在同一基因座上有相同…