Chapter1 WHERE IN THE GENOME DOES DNA REPLICATION BEGIN 一. ·聚合酶启动结构域会结合上游序列的一些位点,这些位点有多个,且特异,并且分布在两条链上.通过计算,找到出现频率最高的k-mer可能为为聚合酶结合位点:dnaA BOX. 但是如何定位Ori的大概位置呢? ·DNA链复制的不对称性,其导致突变速率的不对称,使得有(forward链C->T,脱氨基)的趋势.由此,依据skew增的处于forward链,skew减的处于revers…
Chapter5 HOW DO WE COMPARE DNA SEQUENCES Bioinformatics Algorithms-An_Active Learning Approach http://bioinformaticsalgorithms.com/ 一. 1983年,Russell Doolitte 将血小板源生长因子[platelet derived growth factor(PDGF),一种刺激细胞增殖的物质]和其它已知基因比对,发现它的序列和原癌基因(oncogen…
一.Lloyd算法 算法1 Lloyd Algorithm k_mean clustering * Centers to Clusters: After centers have been selected, assign each data point to the cluster corresponding to its nearest center; ties are broken arbitrarily. * Clusters to Centers: After data points…
Chapter2 WHICH DNA PATTERNS PLAY THE ROLE OF MOLECULAR CLOCKS 寻找模序 一. 转录因子会结合基因上游的特定序列,调控基因的转录表达,但是在不同个体中,这个序列会有一些差别.本章讲述用贪婪.随机算法来寻找这个序列:寻找模序. 二.一些概念: 1. Score.Profile 的含义如图 根据profile matrix 可以计算出某个kmer在某一profile下的概率 三. 提出问题:Motif Finding Problem: Gi…
https://www.quora.com/How-do-I-learn-machine-learning-1?redirected_qid=6578644 How Can I Learn X? Learning Machine Learning Learning About Computer Science Educational Resources Advice Artificial Intelligence How-to Question Learning New Things Lea…
Problem Solving with Algorithms and Data Structures using Python — Problem Solving with Algorithms and Data Structures By Brad Miller and David Ranum, Luther College http://interactivepython.org/runestone/static/pythonds/index.html https://runestone.…
近期在看<Algorithms IN C>这本书.刚開始看,读的是英文版的.感觉作者的叙述有点不太easy理解.就找了一本中文版的来看,发现还是看英文版的比較好.先看了第一章的大部分,后面的总结还没有看,我的感受是.一个小的问题仅仅须要找到一个正确的算法就能够了.根本不许要去考虑算法的效率和性能,仅仅有在解决一些大型的实际问题时,算法的优劣才干体现出来.另外,就是添加机器的性能远不如改善算法的性能贡献大. 第一章举了一个连通性的样例,作者一步一步的引导我们来改进算法,使得这个算法终于能够真正的…
3.1.3 用例举例 在学习它的实现之前我们还是应该先看看如何使用它.相应的我们这里考察两个用例:一个用来跟踪算法在小规模输入下的行为测试用例和一个来寻找更高效的实现的性能测试用例. 3.1.3.1 行为测试用例 为了在小规模的的输入下跟踪算法的行为,我们用一下测试用例测试我们对符号表的所有实现.这段代码会从标准输入接受多个字符串,构造一张符号表来将i 和第i 个字符串相关联,然后打印符号表.我们假设所有的字符串都只有一个字母.一般我们会使用”S E A R C H E X A M P L E”…