脱氧核糖核酸即常说的DNA,是一类带有遗传信息的生物大分子。它由4种主要的脱氧核苷酸(dAMP、dGMP、dCMT和dTMP)通过磷酸二酯键连接而成。这4种核苷酸可以分别记为:A、G、C、T。
    DNA携带的遗传信息可以用形如:AGGTCGACTCCA.... 的串来表示。DNA在转录复制的过程中可能会发生随机的偏差,这才最终造就了生物的多样性。
    为了简化问题,我们假设,DNA在复制的时候可能出现的偏差是(理论上,对每个碱基被复制时,都可能出现偏差):
 1. 漏掉某个脱氧核苷酸。例如把 AGGT 复制成为:AGT
    2. 错码,例如把 AGGT 复制成了:AGCT
    3. 重码,例如把 AGGT 复制成了:AAGGT
    如果某DNA串a,最少要经过 n 次出错,才能变为DNA串b,则称这两个DNA串的距离为 n。
    例如:AGGTCATATTCC 与 CGGTCATATTC 的距离为 2
    你的任务是:编写程序,找到两个DNA串的距离。
【输入、输出格式要求】
    用户先输入整数n(n<100),表示接下来有2n行数据。
    接下来输入的2n行每2行表示一组要比对的DNA。(每行数据长度<10000)
    程序则输出n行,表示这n组DNA的距离。
    例如:用户输入:
3
AGCTAAGGCCTT
AGCTAAGGCCT
AGCTAAGGCCTT
AGGCTAAGGCCTT
AGCTAAGGCCTT
AGCTTAAGGCTT
则程序应输出:
1
1
2
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
思路:刚开始做的时候没啥思路,网上看了一个博客之后突然发现和求最长公共序列很相似,顿时感觉自己脑子锈掉了,之前写过类似的题啊,具体的思路过程为
与其说是DNA比对,不如说是字符串比对,用户输入两个字符串str1和str2,我们把str1作为标准串,由str2变为标准串可以通过重复,丢失和修改三种方法。
重复就是str1[i]=A , str1[i+1]=C , str[i+2]=T ,而对应的str2[i]=A ,str2[i+1] = A ,str2[i+2]=C
丢失就是str1[i]=A , str1[i+1]=C , str[i+2]=T ,而对应的str2[i]=A ,str2[i+1] = T
修改就是str1[i]=A , str1[i+1]=C , str[i+2]=T ,而对应的str2[i]=A ,str2[i+1] = G,str2[i+2]=T
我们假设str1的长度为len1,str2的长度为len2,用数组dp[len1][len2]表示str2变化为str1最少需要几步,也就是我们最后的答案。
我们把这个问题细化,假设dp[i][j]表示str2的字串str1[0]~str1[i-1]变成str1的字串str2[0]~str2[j-1]最少需要的步数
那么对于dp[i][j]可能有两种情况:
str1[i] == str2[j] ,这个时候,dp[i][j] = dp[i-1][j-1]
str1[i] != str2[j] ,这个时候,分为三种情况:
重复的情况:dp[i][j] = dp[i][j-1] +1
ACT
ACTT
dp[3][4] = dp[3][3] +1,因为此时str2的子串比str1的子串多出了一个字符,所以让j回到多出的那个字符前面再进行比较,得到dp[i][j-1]然后在进行了一步重复操作,所以+1
丢失的情况:dp[i][j] = dp[i-1][j] +1
ACTT
ACT
dp[4][3] = dp[3][3] +1 ,因为此时str2的子串比str1的子串丢失了一个字符,所以让i回到丢失的那个字符的前面在进行比较,得到dp[i-1][j]然后再进行一步丢失操作,所以+1
修改的情况:dp[i][j] = dp[i-1][j-1]+1
ACT
AGT
dp[3][3] = dp[2][2]
dp[2][2] = dp[1][1]+1,因为此时str1的子串和str2的长度相同,但是字符不一样,所以i-1,j-1回到上一个状态,然后再+1。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
代码的实现是用的比较常规的一类动态规划题的解法,具体可参考我之前写的最长公共子序列:https://www.cnblogs.com/henuliulei/p/10074366.html
 #include<bits/stdc++.h>

 using namespace std;
int f(string str1,string str2)
{
int Len1=str1.length();
int Len2=str2.length();
int dp[Len1+][Len2+];
memset(dp,,sizeof(dp));
for(int i=;i<=Len1;i++){
dp[i][]=i;
}
for(int j=;j<=Len2;j++){
dp[][j]=j;
}
for(int i=;i<=Len1;i++){
for(int j=;j<=Len2;j++){
if(str1[i-]==str2[j-]){
dp[i][j]=dp[i-][j-];////对应字母相等,array值不增加
}else{
//三个形参分别对应str2在str1的基础上增加,减少和修改的情况
int a=min(dp[i-][j]+,dp[i][j-]+);
dp[i][j]=min(a,dp[i-][j-]+);
}
}
} return dp[Len1][Len2];
}
int main()
{
freopen("D:/Test/Test1.txt","r",stdin);
int n;
cin >> n;
int p=n;
int array[n];
memset(array,,sizeof(array));
int num=;
while(n--){
string str1,str2;
cin >> str1 >> str2; array[num++]=f(str1,str2);
}
for(int i=;i<p;i++){
cout << array[i] << endl;
}
return ;
}

reference:https://blog.csdn.net/qsyzb/article/details/27372073

历届试题_DNA比对的更多相关文章

  1. 蓝桥杯历届试题 地宫取宝 dp or 记忆化搜索

    问题描述 X 国王有一个地宫宝库.是 n x m 个格子的矩阵.每个格子放一件宝贝.每个宝贝贴着价值标签. 地宫的入口在左上角,出口在右下角. 小明被带到地宫的入口,国王要求他只能向右或向下行走. 走 ...

  2. 蓝桥杯  历届试题 幸运数  dfs

    历届试题 幸运数 时间限制:1.0s   内存限制:256.0MB 问题描述 幸运数是波兰数学家乌拉姆命名的.它采用与生成素数类似的"筛法"生成 . 首先从1开始写出自然数1,2, ...

  3. 蓝桥杯  历届试题 剪格子  dfs

    历届试题 剪格子 时间限制:1.0s   内存限制:256.0MB 问题描述 如下图所示,3 x 3 的格子中填写了一些整数. +--*--+--+ |10* 1|52| +--****--+ |20 ...

  4. 算法笔记_189:历届试题 横向打印二叉树(Java)

    目录 1 问题描述 2 解决方案   1 问题描述 问题描述 二叉树可以用于排序.其原理很简单:对于一个排序二叉树添加新节点时,先与根节点比较,若小则交给左子树继续处理,否则交给右子树. 当遇到空子树 ...

  5. 算法笔记_186:历届试题 高僧斗法(Java)

    目录 1 问题描述 2 解决方案   1 问题描述 问题描述 古时丧葬活动中经常请高僧做法事.仪式结束后,有时会有“高僧斗法”的趣味节目,以舒缓压抑的气氛. 节目大略步骤为:先用粮食(一般是稻米)在地 ...

  6. 算法笔记_184:历届试题 约数倍数选卡片(Java)

    目录 1 问题描述 2 解决方案   1 问题描述 问题描述 闲暇时,福尔摩斯和华生玩一个游戏: 在N张卡片上写有N个整数.两人轮流拿走一张卡片.要求下一个人拿的数字一定是前一个人拿的数字的约数或倍数 ...

  7. 算法笔记_183:历届试题 九宫重排(Java)

    目录 1 问题描述 2 解决方案   1 问题描述 问题描述 如下面第一个图的九宫格中,放着 1~8 的数字卡片,还有一个格子空着.与空格子相邻的格子中的卡片可以移动到空格中.经过若干次移动,可以形成 ...

  8. 算法笔记_178:历届试题 邮局(Java)

    目录 1 问题描述 2 解决方案   1 问题描述 问题描述 C村住着n户村民,由于交通闭塞,C村的村民只能通过信件与外界交流.为了方便村民们发信,C村打算在C村建设k个邮局,这样每户村民可以去离自己 ...

  9. 算法笔记_177:历届试题 城市建设(Java)

    目录 1 问题描述 2 解决方案   1 问题描述 问题描述 栋栋居住在一个繁华的C市中,然而,这个城市的道路大都年久失修.市长准备重新修一些路以方便市民,于是找到了栋栋,希望栋栋能帮助他. C市中有 ...

随机推荐

  1. thinkphp cbd模式

    ThinkPHP从3.0版本开始引入了全新的CBD(核心Core+行为Behavior+驱动Driver)架构模式,因为从底层开始,框架就采用核心+行为+驱动的架构体系,核心保留了最关键的部分,并在重 ...

  2. 2018-2019-2 20175323 实验一《Java开发环境的熟悉》实验报告

    java开发环境的熟悉-1 java开发环境的熟悉-2 下载IDEA和破解的过程我参考了https://blog.csdn.net/shengshengshiwo/article/details/79 ...

  3. 牛客多校第六场 E Androgynos 自补图

    题意: 给定点数,构造自补图,要求输出邻接矩阵,和原图与补图的同构映射. 题解: 只有点数为4k和4k+1的情况才能构造自补图,因为只有这些情况下边数才为偶数. 一种构造方式是,邻接矩阵和同构映射增量 ...

  4. yolo自己的数据集中LabelImg的安装出现No module named 'libs.resources'错误

    以下是完整的安装过程,如果出现No module named 'libs.resources',直接看第四点. 1.安装PyQt,在官网下载吧,否则pip install 要等好久 2.安装PyQtT ...

  5. CSS 属性1

    CSS列表属性 list-style:列表样式,取值:none.去掉项目符号或编号前面的各种符号. CSS边框属性:每个元素都可以加边框线  border-left:左边框线.   格式:border ...

  6. UVA 12412 A Typical Homework (a.k.a Shi Xiong Bang Bang Mang)

    题目链接:https://vjudge.net/problem/UVA-12412 题目大意 略. 分析 比较大规模的模拟,注意输入输出,浮点数精度,还有排名相同的输出顺序,还有一些边界情况处理. 代 ...

  7. 纯CSS3实现图片展示特效

    本文中要实现的一个纯CSS3的图片展示特效,以前只能用JavaScript实现,可想而知会受到多方面的限制,特别是性能.而今天我们将用简单的CSS3代码实现,你会发现它的动画效果在现代浏览器的帮助下无 ...

  8. Window中在Intellij idea开发时常用快捷键

    以下idea中的快捷键是在window 7中确认过,如果快捷键不起作用,可能是该快捷键被其它软件占用,或系统不同导致. 1.Ctrl + Z:撤回代码: 2.Ctrl + Shift + Z:恢复撤回 ...

  9. <Django> MVT三大块之Models(模型)

    1.ORM(对象-关系-映射)---面向对象,不需要面向SQL语句 根据对象的类型生成表结构 将对象.列表的操作,转化成SQL语句 将SQL语句查询的结果转化成对象.列表 目的:实现数据模型与数据库的 ...

  10. dedecms 调用英文标题和栏目描述

    调用英文标题: 参考文献 http://www.dedecms51.com/dedecmsjiaocheng/chengxukaifa/149476.html 增加 dede/templets/cat ...