互信息已广泛应用于特征选择问题,但应用在 SNP 选择上还存在着一些局限.第一,互信息只能衡量一个 SNP 组合与表型的相关性, 无法衡量多个 SNP 与表型的相关性.第二, 利用互信息排序 SNP 时,隐含着一个假设,即: SNP 间是相互独立的,不存在着依赖关系.然而事实上,SNP 间存在着广泛的交互作用.因此,互信息排序 SNP 会严重低估交互作用 SNP 的重要性.第三,利用互信息选择 SNP 组合时,任意加入一个新 SNP 都会使互信息值不小于加入前该 SNP 组合的互信息值,限制了不
Predicting effects of noncoding variants with deep learning–based sequence model PDF Interpreting noncoding variants- 非常好的学习资料 这篇文章的第一个亮点就是直接从序列开始分析,第二就是使用深度学习获得了很好的预测效果. This is, to our knowledge, the first approach for prioritization of functional
生命组学 同义突变虽然不改变蛋白质种类,但是影响量,修饰的稳定性. SNP vs mutation SNV单核苷酸变化,mutation,SNP是从群体角度思考的,约有1%,mutation比SNP还低. Alleles and genotype 多种效应叠加比孟德尔遗传出现的概率高. 依据SNP将人群分开,分别用药,研究不同人群(不同变异)对该药物的反应. 疗效研究药物靶点,药物动力学研究药物代谢途径. ====================================== 药物动力学
目前,很多特征选择文献主要是依据对共信息的直观认识使用它,即:正值表示表型的存在使特征间依赖程度增加,是特征间存在相互作用的证据:负值表示表型的存在使特征间冗余性增加:零表示特征是相互独立的,或者说,是特征间的增益与冗余相互抵消了.因此,从理论上深入认识共信息是一项创新工作. 识别阶段的第一项工作是使用共信息测度穷举搜索候选 SNP 集合中的 SNP 交互作用.当 SNP 组合中所有 SNP 与表型的共信息为正时,说明表型使 SNP 间的依赖程度增加了,是 SNP 组合与表型间存在相互作用的证据