HDU 1560 DNA sequence（DNA序列）

Time Limit: 15000/5000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)

Problem Description - 题目描述

　　The twenty-first century is a biology-technology developing century. We know that a gene is made of DNA. The nucleotide bases from which DNA is built are A(adenine), C(cytosine), G(guanine), and T(thymine). Finding the longest common subsequence between DNA/Protein sequences is one of the basic problems in modern computational molecular biology. But this problem is a little different. Given several DNA sequences, you are asked to make a shortest sequence from them so that each of the given sequence is the subsequence of it.

　　For example, given "ACGT","ATGC","CGTT" and "CAGT", you can make a sequence in the following way. It is the shortest but may be not the only one.

二十一世纪是生物技术突飞猛进的世纪。我们知道基因由DNA组成。构建DNA的核苷酸有A(腺嘌呤)，C(胞嘧啶)，G(鸟嘌呤)和T(胸腺嘧啶)。寻找DNA/蛋白质序列间的最长公共子序列是现代计算分子生物学的基本问题之一。然而这个问题有些许不同。给定若干DNA序列，你需要构建一个最短序列使得给定序列都是都是它的子序列。
 
比如。给定"ACGT"，"ATGC"，"CGTT"和"CAGT"，你可以通过如下方式构建一个序列。最短序列不唯一。

Input - 输入

　　The first line is the test case number t. Then t test cases follow.

　　In each case, the first line is an integer n ( 1<=n<=8 ) represents number of the DNA sequences.

　　The following k lines contain the k sequences, one per line. Assuming that the length of any sequence is between 1 and 5.

第一行为测试用例的数量t。随后t个测试用例。
每个用例中第一行为一个整数n ( 1<=n<=8 ) 表示DNA序列的数量。
随后k行，每行一个序列。假定任意序列长度为1到5。

Output - 输出

　　For each test case, print a line containing the length of the shortest sequence that can be made from these sequences.

对于每个测试用例，输出一行可构建序列的最短长度。

Sample Input - 输入样例

1
4
ACGT
ATGC
CGTT
CAGT

Sample Output - 输出样例

题解

　　IDA* = （暴力DFS + 剪枝）*反反复复，所以问题在于怎么剪枝

　　如果用剩余待匹配序列的最大长度来剪枝……下面的数据就有问题（虽然HDU上并没有）

1
4
AAAA
CCCC
GGGG
TTTT

　　然后秉着不会做就百度的原则（逃

　　横着看有问题，竖着看？

　　统计每行ACGT的个数，然后在以此求各个ACGT最大的和，依次剪枝就比上面的方法科学多了……

代码 C++

 #include <cstdio>
 #include <cstring>
 #include <algorithm>
 int maxDeep, n, data[][];
 int vle(int(&siz)[][]) {
     int i, j, opt, len[];
     memset(len, , sizeof len);
     for (i = ; i < n; ++i) {
         for (j = ; j < ; ++j) len[j] = std::max(len[j], siz[i][j]);
     }
     for (i = opt = ; i < ; opt += len[i++]);
     return opt;
 }
 int DFS(int deep, int(&preW)[], int(&preSiz)[][]) {
     int i = vle(preSiz), j, w[], siz[][], isFid;
     if (!i) return ;
     if (i + deep > maxDeep) return ;
     for (i = ; i < ; ++i) {
         memcpy(w, preW, sizeof w); memcpy(siz, preSiz, sizeof siz);
         for (j = isFid = ; j < n; ++j) {
             if (data[j][w[j]] == i) {
                 isFid = ++w[j]; --siz[j][i];
             }
         }
         if (isFid && DFS(deep + , w, siz)) return ;
     }
     return ;
 }
 int main() {
     int t, i, j, mp[], w[], siz[][];
     mp['A'] = ; mp['C'] = ; mp['G'] = ; mp['T'] = ;
     memset(w, , sizeof w);
     char str[];
     scanf("%d", &t);
     while (t--) {
         memset(data, , sizeof data); memset(siz, , sizeof siz);
         scanf("%d ", &n);
         for (i = ; i < n; ++i) {
             gets(str);
             for (j = ; str[j]; ++j) ++siz[i][data[i][j] = mp[str[j]]];
         }
         for (maxDeep = vle(siz); !DFS(, w, siz); ++maxDeep);
         printf("%d\n", maxDeep);
     }
     return ;
 }

HDU 1560 DNA sequence（DNA序列）的更多相关文章

hdu 6299 Balanced Sequence (括号序列,贪心)
大意: 记$f(t)$表示字符串$t$的最长括号匹配子序列, 给定n个括号序列, 求它们重排后的最大f(t). 首先可以注意到一个括号序列中已经匹配的可以直接消去, 一定不会影响最优解. 那么这样最终 ...
POJ1699 HDU 1560 Best Sequence(AC自动机最短路)
曾写过迭代加深搜索的方法,现在使用在AC自动上跑最短路的方法 dp[i][j]表示状态为到节点i,模式串是否包含的状态为j的最短串的长度,则状态转移方程为: dp[nx][ny] = min(dp[x ...
hdu 1560 DNA sequence(搜索)
http://acm.hdu.edu.cn/showproblem.php?pid=1560 DNA sequence Time Limit: 15000/5000 MS (Java/Others) ...
hdu 1560 DNA sequence(迭代加深搜索)
DNA sequence Time Limit : 15000/5000ms (Java/Other) Memory Limit : 32768/32768K (Java/Other) Total ...
DNA sequence HDU - 1560
DNA sequence Time Limit: 15000/5000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Tot ...
【HDU - 1560】DNA sequence （dfs+回溯）
DNA sequence 直接中文了题目描述 21世纪是生物科技飞速发展的时代.我们都知道基因是由DNA组成的,而DNA的基本组成单位是A,C,G,T.在现代生物分子计算中,如何找到DNA之间的最长 ...
DNA sequence open reading frames (ORFs) | DNA序列的开放阅读框ORF预测
常见的ORF预测工具 Open Reading Frame Finder- NCBI ORF Finder - SMS OrfPredictor - YSU 基本概念开放阅读框(英语:Open r ...
HDU1560 DNA sequence —— IDA*算法
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1560 DNA sequence Time Limit: 15000/5000 MS (Java/Oth ...
POJ 2778 DNA Sequence（AC自动机+矩阵加速）
DNA Sequence Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 9899 Accepted: 3717 Desc ...

随机推荐

批量将PowerDesigner中表字段由小写变成大写
通过以下VB脚本即可批量修改,在Tools=>Execute Commands下的Edit/Run Scripts,或者通过Ctrl+Shift+X运行以下脚本即可: '************ ...
好用的一些 git 命令
git stash 将已修改未提交的改动保存起来恢复用git stash pop gir revert 反转commit git rebase 更换基础分支 git grep -n 显示 ...
Azure基础（三）- Azure的物理架构和服务保证
Azure fundamentals - Core Cloud Services - Azure architecture and service guarantees Azure provides ...
[LeetCode] 55. Jump Game_ Medium tag: Dynamic Programming
Given an array of non-negative integers, you are initially positioned at the first index of the arra ...
LeetCode 15 输入无序、有重复，输出排重版 3-Sum
V1 粗暴的遍历,时间复杂度O(N³) func threeSumClosest(nums []int, target int) int { min := 0 result := 0 for i := ...
git删除和提交
//删除git分支git branch -D BranchNamegit branch -r -D origin/BranchNamegit push origin -d BranchName//提交 ...
Shadow DOM及自定义标签
参考链接:点我一.什么是Shadow DOM Shadow DOM,直接翻译的话就是影子 DOM,可以理解为潜藏在 DOM 结构中并且我们无法直接控制操纵的 DOM 结构.类似于下面这种结构 Sh ...
asp.net无限递归
private void button1_Click(object sender, EventArgs e) { DialogResult dialogResult = folderBrowserDi ...
MySql 版本
MySql 版本: netformwork 2.0 netformwork 4.0
ASP.NET MVC案例教程（六）
ASP.NET六一个小难题我们继续完善“MVC公告发布系统”,这次,我们的需求是对公告发布功能添加日志记录能力,即在发布公告前,记录一次,在公告发布成功后,再记录一次.然后还要使得其具备异常处理, ...

HDU 1560 DNA sequence（DNA序列）

HDU 1560 DNA sequence（DNA序列）

HDU 1560 DNA sequence（DNA序列）的更多相关文章

随机推荐

热门专题