P4303 [AHOI2006]基因匹配

标签(空格分隔): 考试题 nt题 LCS优化


【题目】

卡卡昨天晚上做梦梦见他和可可来到了另外一个星球,这个星球上生物的DNA序列由无数种碱基排列而成(地球上只有4种),而更奇怪的是,组成DNA序列的每一种碱基在该序列中正好出现5次!这样如果一个DNA序列有N种不同的碱基构成,那么它的长度一定是5N。

卡卡醒来后向可可叙述了这个奇怪的梦,而可可这些日子正在研究生物信息学中的基因匹配问题,于是他决定为这个奇怪星球上的生物写一个简单的DNA匹配程序。

为了描述基因匹配的原理,我们需要先定义子序列的概念:若从一个DNA序列(字符串)s中任意抽取一些碱基(字符),将它们仍按在s中的顺序排列成一个新串u,则称u是s的一个子序列。对于两个DNA序列s1和s2,如果存在一个序列u同时成为s1和s2的子序列,则称u是s1和s2的公共子序列。

卡卡已知两个DNA序列s1和s2,求s1和s2的最大匹配就是指s1和s2最长公共子序列的长度。

[任务] 编写一个程序:

从输入文件中读入两个等长的DNA序列;

计算它们的最大匹配;

向输出文件打印你得到的结果。

输入格式

输入文件中第一行有一个整数N,表示这个星球上某种生物使用了N种不同的碱基,以后将它们编号为1…N的整数

以下还有两行,每行描述一个DNA序列:包含5N个1…N的整数,且每一个整数在对应的序列中正好出现5次。

输出格式

输出文件中只有一个整数,即两个DNA序列的最大匹配数目。

输入输出样例

输入1

2

1 1 1 1 1 2 2 2 2 2

1 1 1 2 2 2 2 2 1 1

输出1

8

输入2

2

1 1 2 2 1 1 2 1 2 2

1 2 2 2 1 1 2 2 1 1

输出2

7

说明/提示

1≤N≤20000

【思路】

扯点别的

看此题前先观光一下前提级博客:https://www.cnblogs.com/614685877--aakennes/p/12663440.html,与本题密切相关。

考试时乍一看一个LCS板子,再一看数据范围,显然n²的效率A不了,于是乎就想起之前写过得一道题(上面那个博客),用lis优化lcs,时间效率为nlogn,但那道题显然有个限制条件:序列中所有的数都相等。这道题明确给出了重复的个数,一开始我就想用普通的5*x+cnt[x]来存,之后跟王子公主那道题一样,结果连样例都过不去(但竟然有50分),然后就摸了。

之后看到题解十分气愤,竟然真是王子公主的变种,很气。


正解

在王子公主中我们b序列中的一个数对应a序列中这个数的位置,然后对应到b序列中,最后跑一遍lis。这道题我们可以把b序列中的一个数对应到a序列中这个数的所有位置,倒序存进b序列里面。

问题1:为什么要存所有位置

表面上我们存进了所有的位置,实际上我们只需要用这些位置的某一个最优值就可以。拿样例2来说,我们倒序存入后,新数组:(1)8 6 5 2 1 |(2) 10 9 7 4 3 |(3) 10 9 7 4 3 |(4) 10 9 7 4 3 |(5) 8 6 5 2 1 |(6) 8 6 5 2 1 |(7) 10 9 7 4 3 |(8) 10 9 7 4 3 |(9) 8 6 5 2 1 |(10) 8 6 5 2 1 1,最长上升子序列的数依次来源于:第一个串的1,第二个串的3,第三个串的4,第五个串的5,第六个串的6,第七个串的7,第九个串的8。

问题2:为什么要倒序

每一个串一开始一定是一个上升的子序列,所以倒序后一定是一个下降的子序列,这样在跑lis的时候我们只会用到这个串中的一个数。相反,如果你不倒序,肯定就会用到这个串所有数,结果定然不对。

【代码】

#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
#include<cmath>
#include<map>
using namespace std;
const int maxn=1e6+5,maxe=250*250+5,INF=0x3f3f3f3f;
int n,f[maxn],a[20005][20005],b[maxn],low[maxn],cnt[maxn];
inline int read(){
int s=0,w=1;
char ch=getchar();
while(ch<'0'||ch>'9'){if(ch=='-')w=-1;ch=getchar();}
while(ch>='0'&&ch<='9') s=s*10+ch-'0',ch=getchar();
return s*w;
}
int main(){
freopen("a.in","r",stdin);
// freopen("dinning.out","w",stdout);
n=read();
int maxmax=0;
memset(low,0,sizeof(low));
for(int i=1;i<=n*5;i++){
int x=read();
a[++cnt[x]][x]=i;
}//a[cnt[x]][x]表示x在第一个序列中出现第cnt[x]次的位置
memset(cnt,0,sizeof(cnt));
int len=0;
for(int i=1;i<=n*5;i++){
int x=read();
for(int j=5;j>=1;j--)b[++len]=a[j][x];//倒序存入每一个串
}
int len1=1;
low[1]=b[1];
for(int i=2;i<=len;i++){
if(low[len1]<b[i])low[++len1]=b[i];
else low[lower_bound(low+1,low+len1+1,b[i])-low]=b[i];
}
printf("%d\n",len1);
}

OVER~

【线型DP】【LCS】洛谷P4303 [AHOI2006]基因匹配的更多相关文章

  1. 洛谷P4303 [AHOI2006]基因匹配(树状数组)

    传送门 我已经连这种傻逼题都不会了orz 正常的dp是$O(n^2)$的,枚举第一个数组的$j$,然后第二个数组的$k$,如果相等,则$dp[i]=dp[j]+1$,否则$dp[i]=dp[j]$ 然 ...

  2. 【线型DP】洛谷P2066 机器分配

    [线型DP]洛谷P2066 机器分配 标签(空格分隔): 线型DP [题目] 题目描述 总公司拥有高效设备M台,准备分给下属的N个分公司.各分公司若获得这些设备,可以为国家提供一定的盈利.问:如何分配 ...

  3. P4303 [AHOI2006]基因匹配 未完成

    题目 luogu 暴力60pts部分 显然如果没有出现次数==5的条件 显然是\(N_{2}\)的求lcs的模板 但是加点条件就完全不同了 思路 这个题短小精悍,不想数据结构那么傻逼无脑 我们考虑一下 ...

  4. 洛谷P1140 相似基因 (DP)

    洛谷P1140 相似基因 题目背景 大家都知道,基因可以看作一个碱基对序列.它包含了44种核苷酸,简记作A,C,G,TA,C,G,T.生物学家正致力于寻找人类基因的功能,以利用于诊断疾病和发明药物. ...

  5. BZOJ 1264: [AHOI2006]基因匹配Match( LCS )

    序列最大长度2w * 5 = 10w, O(n²)的LCS会T.. LCS 只有当a[i] == b[j]时, 才能更新答案, 我们可以记录n个数在第一个序列中出现的5个位置, 然后从左往右扫第二个序 ...

  6. bzoj 1264 [AHOI2006]基因匹配Match(DP+树状数组)

    1264: [AHOI2006]基因匹配Match Time Limit: 10 Sec  Memory Limit: 162 MBSubmit: 793  Solved: 503[Submit][S ...

  7. bzoj1264 [AHOI2006]基因匹配Match 树状数组+lcs

    1264: [AHOI2006]基因匹配Match Time Limit: 10 Sec  Memory Limit: 162 MBSubmit: 1255  Solved: 835[Submit][ ...

  8. BZOJ 1264: [AHOI2006]基因匹配Match 树状数组+DP

    1264: [AHOI2006]基因匹配Match Description 基因匹配(match) 卡卡昨天晚上做梦梦见他和可可来到了另外一个星球,这个星球上生物的DNA序列由无数种碱基排列而成(地球 ...

  9. 【BZOJ1264】[AHOI2006]基因匹配Match DP+树状数组

    [BZOJ1264][AHOI2006]基因匹配Match Description 基因匹配(match) 卡卡昨天晚上做梦梦见他和可可来到了另外一个星球,这个星球上生物的DNA序列由无数种碱基排列而 ...

随机推荐

  1. install-package : 由于无法加载项目 mydemo 的详细信息,操作失败

    安装nuget package包提示错误 install-package : 由于无法加载项目 mydemo 的详细信息,操作失败 解决方法 项目用dotnet cli 命令dotnet new mv ...

  2. 获取Google浏览器保存的密码

    获取Google中保存的密码 直接在浏览器上输入 chrome://settings/passwords

  3. 4.keras-交叉熵的介绍和应用

    keras-交叉熵的介绍和应用 1.载入数据以及预处理 import numpy as np from keras.datasets import mnist from keras.utils imp ...

  4. rgb格式颜色与#000000格式颜色的转换

    首先,#000000格式的颜色被成为十六进制颜色码: 6位数分为三组,每两位数一组,依次是红.黄.蓝颜色的强度: 而与此对应的,rgb(39,137,202)依次是十进制的红黄蓝颜色: 因此将rgb格 ...

  5. [转] 允许root通过ssh远程登录

    点击阅读原文 在Ubuntu中允许root远程访问 如果使用如xshell等远程工具首次通过root连接Ubuntu会提示拒绝访问,并不是密码不正确,而是Ubuntu默认禁止以root远程连接. 我们 ...

  6. 【Android】使用Appium+python控制真机,碰到的问题以及处理(持续更新)

    问题: selenium.common.exceptions.WebDriverException: Message: A new session could not be created. (Ori ...

  7. 私有云nextcloud、seafile、syncthing的比较

    可选 nextcloud.seafile.syncthing 1. seafile https://www.jianshu.com/p/43f570118e63 https://www.jianshu ...

  8. 小师妹学JVM之:JDK14中JVM的性能优化

    目录 简介 String压缩 分层编译(Tiered Compilation) Code Cache分层 新的JIT编译器Graal 前置编译 压缩对象指针 Zero-Based 压缩指针 Escap ...

  9. yii2.0AR两表联查

    首先,建两个关联表. 表一 -- Table structure for article -- ---------------------------- DROP TABLE IF EXISTS `a ...

  10. ca75a_c++_标准IO库-利用流对象把文件内容读取到向量-操作文件

    /*ca75a_c++_标准IO库习题练习习题8.3,8.4,8.6习题8.9.8.10 ifstream inFile(fileName.c_str());1>d:\users\txwtech ...