URL: http://www.ibiomedical.net/ http://103.53.216.7/ Go to aldb database. (keywords: chicken, cow, pig; lincRNAs; expression; blast)ALDB: a domestic-animal long noncoding RNA database Go to miRBond database. (keywords: pig, chicken, cow, targetscan,…
URL: http://www.ibiomedical.net/pigsps/ keywords: pig, boar, SNP, positive selection, database, db, pigsps…
正向选择:某一位点逐渐积累,成优势的位点,具体表现为:随着时间延长,该位点的突变allele频率越来越高,远远超过野生型allele: 中性选择:随着时间的延长,总体频率没有改变太多: 平衡选择:位点呈现多态性,且一直保持着平衡,人类的ABO血型系统就是典型的平衡选择: 具体示意图,可以见下图: 图片来源:SIGNATURES OF NATURAL SELECTION IN THE HUMAN GENOME 自然选择与适合度(f )的关系: A野生型,a突变型 如果f_AA=f_Aa=f_aa,…
李爱民-西安理工大学计算机科学与工程学院 ● 简介(Introduction)-> 李爱民(Aimin Li),男,湖北随州人,西安电子科学大学博士(PhD),中共党员.中国计算机学会会员,CSC访问学者,主要研究方向为生物信息学(Bioinformatics).机器学习(Machine Learning).发表学术论文30篇,其中SCI论文14篇,获发明专利1项.主审教材1部. 主持或参与科研项目20余项.高级程序员(信息产业部),软件工程师(陕西省人事厅Software Engineer),…
1. If dN/dS = 1, amino-acid substitutions may be largely neutral. However, there is also the possibility that positive selection just cancels purifying selection, so that some amino- acid substitutions were driven by natural selection. This situation…
一.Scikit Learn中使用estimator三部曲 1. 构造estimator 2. 训练模型:fit 3. 利用模型进行预测:predict 二.模型评价 模型训练好后,度量模型拟合效果的常见准则有: 1.      均方误差(mean squared error,MSE): 2.      平均绝对误差(mean absolute error,MAE) 3.      R2 score:scikit learn线性回归模型的缺省评价准则,既考虑了预测值与真值之间的差异,也考虑了问题…
1.Hard and soft selective sweeps 长期以来,快速适应主要与选择作用于高度多基因的数量性状有关,例如在育种试验期间.这些性状可以通过对大量已经存在的多态性的群体频率的微小调整,对选择压力的变化作出快速反应.在这个所谓的“无穷小模型”下,适应性预计会在群体基因组数据中留下微妙的特征,因为潜在的多态性可能在群体中存在了足够长的时间,从而与其周围的遗传变异脱钩.然而,最近的研究表明,快速适应往往只涉及少数几个具有巨大个体效应的等位基因,而这些等位基因以前在种群中很少见,甚…
(Gene prediction and comparison) 使用基于基因组序列的从头预测方法(Ab initio methods)(同时分别使用头预测软件( GENSCAN和 AUGUSTUS)和预测exon和intron的剪切位点.)和基于证据支持的基因预测(Evidence-based methods)(与dog和human比较).得到不同基因座数目.最后做了一个panda的参考基因集.   (measure the quality of gene prediction):通过比较不同…
生命组学 研究old gene 和 young gene CAI选择信号:CGmutation信号 Neutrality plot:CG3与GC1.GC2的关系:平:mutation:正相关:selection signal Ks Ka Ka/ Ks代表选择压力,Core gene Ka/ Ks比较小,即纯化选择(负选择). =============== 热力学第二定律 利用二进制表示密码表,core gene的随机性更强(热二就是能量越强熵越大) ============ Gene gain…
Design based on biology 通过比较基因组学的方法,将脊椎动物基因组的数据,解决生物学各方面问题.新的调控注释(在脊椎动物的进化过程中的出现的)可以丰富物种树(比如不同功能蛋白质进化速度上的差异(因为编码蛋白质基因和早期进化基因的发现)). Sequencing 需要以下两种策略叠加: 1.Pooled genome sequence strategies :测同一物种的不同个体,不同个体叠加. 2.representative genome assembly approac…