一.数据为什么要做质量控制 比起表观学研究,GWAS研究很少有引起偏差的来源,一般来说,一个人的基因型终其一生几乎不会改变的,因此很少存在同时影响表型又影响基因型的变异.但即便这样,我们在做GWAS时也要去除一些可能引起偏差的因素. 这种因素主要有:群体结构.个体间存在血缘关系.技术性操作. 二.怎么看数据是否需要进行质量控制 下面分别为样本和SNP位点在数据中的直方图,当数据不在绝大多数的分布当中时,我们会倾向于认为那是测序.人工操作等其他方面造成的误差,而非该个体的真实情况,因此是需要将这些…