PTA L3-020 至多删三个字符 (序列dp/序列自动机)
给定一个全部由小写英文字母组成的字符串,允许你至多删掉其中 3 个字符,结果可能有多少种不同的字符串?
输入格式:
输入在一行中给出全部由小写英文字母组成的、长度在区间 [4, 1] 内的字符串。
输出格式:
在一行中输出至多删掉其中 3 个字符后不同字符串的个数。
输入样例:
ababcc
输出样例:
25
提示:
删掉 0 个字符得到 "ababcc"。
删掉 1 个字符得到 "babcc", "aabcc", "abbcc", "abacc" 和 "ababc"。
删掉 2 个字符得到 "abcc", "bbcc", "bacc", "babc", "aacc", "aabc", "abbc", "abac" 和 "abab"。
删掉 3 个字符得到 "abc", "bcc", "acc", "bbc", "bac", "bab", "aac", "aab", "abb" 和 "aba"。
解法:
前置技能:求一个序列中所有的不同子序列个数。
eg:FZU - 2129
设dp[i]为序列a的前i个元素所组成的不同子序列个数,则有状态转移方程:$dp[i]=\left\{\begin{matrix}\begin{aligned}&2dp[i-1]+1,pre[a[i]]=-1\\&2dp[i-1]-dp[pre[a[i]]-1],pre[a[i]]\neq -1\end{aligned}\end{matrix}\right.$
其中pre[a[i]]表示a[i]前面第一个和a[i]相同的元素的下标。
解释:第i个元素a[i]有两种选择:选或不选。
若不选a[i],则dp[i]继承dp[i-1]的全部子序列,因此有dp[i]+=dp[i-1]。
若选a[i],则dp[i]在dp[i-1]的全部子序列的尾部填加了个元素a[i],因此仍有dp[i]+=dp[i-1]。但这样会有很多重复的序列,因此要去重,即去掉前面和a[i]相同的元素之前的序列(因为它们加上a[i]形成的序列已经被算过了),因此有dp[i]-=dp[pre[a[i]]-1]。特别地,如果a[i]前面没有与a[i]相同的元素,那么没有重复的序列,并且a[i]自己单独形成一个新序列,此时dp[i]++。
#include<cstdio>
#include<cstring>
using namespace std;
typedef long long ll;
typedef double db;
const int N=1e6+,mod=1e9+;
int a[N],n,dp[N],pre[N];
int main() {
while(scanf("%d",&n)==) {
memset(pre,-,sizeof pre);
for(int i=; i<=n; ++i)scanf("%d",&a[i]);
dp[]=;
for(int i=; i<=n; ++i) {
dp[i]=(ll)dp[i-]*%mod;
if(~pre[a[i]])dp[i]=((ll)dp[i]-dp[pre[a[i]]-])%mod;
else dp[i]=(dp[i]+)%mod;
pre[a[i]]=i;
}
printf("%d\n",(dp[n]+mod)%mod);
}
return ;
}
回到正题,此题是上题的升级版,等价于求一个长度为n的序列中长度为n,n-1,n-2,n-3的不同子序列个数之和。
基本思路是一致的,只需要在上述代码的基础上稍作改动即可。
设dp[i][j]为前i个元素删了j个元素所形成的子序列个数,则有$dp[i][j]=\left\{\begin{matrix}\begin{aligned}&dp[i-1][j-1]+dp[i-1][j],pre[a[i]]=-1,j\neq i-1\\&dp[i-1][j-1]+dp[i-1][j]+1,pre[a[i]]=-1,j=i-1\\&dp[i-1][j-1]+dp[i-1][j]-dp[pre[a[i]]-1][j-(i-pre[a[i]])],pre[a[i]]\neq -1\end{aligned}\end{matrix}\right.$
推导过程类似,注意j的变化即可。
#include<cstdio>
#include<cstring>
using namespace std;
typedef long long ll;
typedef double db;
const int N=1e6+;
char a[N];
int n,pre[];
ll dp[N][];
int main() {
memset(pre,-,sizeof pre);
scanf("%s",a+),n=strlen(a+);
for(int i=; i<=n; ++i) {
for(int j=; j<=; ++j) {
if(j>)dp[i][j]+=dp[i-][j-];
dp[i][j]+=dp[i-][j];
if(~pre[a[i]]&&j>=i-pre[a[i]])dp[i][j]-=dp[pre[a[i]]-][j-(i-pre[a[i]])];
else if(i==j+)dp[i][j]++;
}
pre[a[i]]=i;
}
printf("%lld\n",dp[n][]+dp[n][]+dp[n][]+dp[n][]);
return ;
}
还有另一种解法是利用序列自动机,很简单,设go[i][j]为第i个元素后第一个元素j出现的位置,先用类似dp的方式建立自动机,则问题转化成了一个DAG上的dp问题。
但是由于序列自动机空间消耗较大,直接dfs可能会爆内存,比如这样:
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
typedef double db;
const int N=1e6+,M=;
char s[N];
int n,go[N][M],dp[N][];
void build() {
memset(go[n],,sizeof go[n]);
for(int i=n-; i>=; --i)memcpy(go[i],go[i+],sizeof go[i]),go[i][s[i]-'a']=i+;
}
int dfs(int u,int k) {
if(k>)return ;
int& ret=dp[u][k];
if(~ret)return ret;
ret=(k+(n-u)<=);
for(int i=; i<M; ++i)if(go[u][i])ret+=dfs(go[u][i],k+go[u][i]-u-);
return ret;
}
int main() {
scanf("%s",s),n=strlen(s);
build();
memset(dp,-,sizeof dp);
printf("%d\n",dfs(,));
return ;
}
解决方法是自底而上,一遍dp一遍更新go数组,成功AC:
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
typedef double db;
const int N=1e6+,M=;
char s[N];
int n,go[M];
ll dp[N][];
int main() {
scanf("%s",s),n=strlen(s);
dp[n][]=dp[n][]=dp[n][]=dp[n][]=;
for(int i=n-; i>=; --i) {
go[s[i]-'a']=i+;
for(int j=; j<=; ++j) {
dp[i][j]=(j+(n-i)<=);
for(int k=; k<M; ++k)if(go[k]&&j+go[k]-i-<=)dp[i][j]+=dp[go[k]][j+go[k]-i-];
}
}
printf("%lld\n",dp[][]);
return ;
}
虽然序列自动机的功能比较强大,但时间和空间的消耗都与元素集合的大小有关,因此当元素集合过大的时候,可能就并不吃香了~~
PTA L3-020 至多删三个字符 (序列dp/序列自动机)的更多相关文章
- pta l3-20(至多删三个字符)
题目链接:https://pintia.cn/problem-sets/994805046380707840/problems/994805046946938880 题意:给定一个长度<=106 ...
- L3-020 至多删三个字符 (30 分)(DP)
题目链接:https://pintia.cn/problem-sets/994805046380707840/problems/994805046946938880 学习地址: 2018CCCC-L3 ...
- L3-020 至多删三个字符 (30 分)
给定一个全部由小写英文字母组成的字符串,允许你至多删掉其中 3 个字符,结果可能有多少种不同的字符串? 输入格式: 输入在一行中给出全部由小写英文字母组成的.长度在区间 [4, 1] 内的字符串. 输 ...
- PAT L3-020 至多删三个字符
https://pintia.cn/problem-sets/994805046380707840/problems/994805046946938880 给定一个全部由小写英文字母组成的字符串,允许 ...
- L3-020 至多删三个字符 (30 分) 线性dp
给定一个全部由小写英文字母组成的字符串,允许你至多删掉其中 3 个字符,结果可能有多少种不同的字符串? 输入格式: 输入在一行中给出全部由小写英文字母组成的.长度在区间 [4, 1] 内的字符串. 输 ...
- PTA 团体程序设计天梯赛 L3-020 至多删三个字符
$f[i][j]$表示到第$i$个字符,已经删去了$j$个字符的方案数. 显然的转移: $f[i][j] = f[i - 1][j] + f[i - 1][j - 1]$ 但是这样会有重复,我们考虑什 ...
- [leetcode]680. Valid Palindrome II有效回文II(可至多删一原字符)
Given a non-empty string s, you may delete at most one character. Judge whether you can make it a pa ...
- PTA 最多删除3个字符(DP) - 30分
给定一个全部由小写英文字母组成的字符串,允许你至多删掉其中 3 个字符,结果可能有多少种不同的字符串? 输入格式: 输入在一行中给出全部由小写英文字母组成的.长度在区间 [4, 1] 内的字符串. 输 ...
- windows自带记事本导致文本文件(UTF-8编码)开头三个字符乱码问题
在windows平台下,使用系统的记事本以UTF-8编码格式存储了一个文本文件,但是由于Microsoft开发记事本的团队使用了一个非常怪异的行为来保存UTF-8编码的文件,它们自作聪明地在每个文件开 ...
随机推荐
- 把 html标签转化为 html标签代码
HttpUtility.HtmlEncode(table.Rows[0]["footnote"].ToString());
- 理解 $nextTick 的作用
有同学在看 Vue 官方文档时,对 API 文档中的 Vue.nextTick 和 vm.$nextTick 的作用不太理解. 其实如果看一下深入响应式原理 - vue.js中的有关内容,可能会有所理 ...
- 20145229吴姗姗web安全基础实践
20145229吴姗姗web安全基础实践 基础与实践 基础问题 (1)SQL注入攻击原理,如何防御 SQL注入就是把SQL语句插入到之前已经定义好的语句中,作为网页中的比如用户名输入来达到攻击的目的, ...
- 深入理解Java虚拟机(1)--Java内存区域
运行时数据区域 Java虚拟机在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区域.这些区域有各自的用途,以及创建和销毁的时间,有的区域随着虚拟机进程的启动而存在,有些区域则是依赖用 ...
- 在NLP中深度学习模型何时需要树形结构?
在NLP中深度学习模型何时需要树形结构? 前段时间阅读了Jiwei Li等人[1]在EMNLP2015上发表的论文<When Are Tree Structures Necessary for ...
- 微信app支付java后台流程、原理分析及nei网穿透
一.流程步骤 本实例是基于springmvc框架编写 1.执行流程 当手机端app(就是你公司开发的app)在支付页面时,调起服务端(后台第1个创建订单接口)接口,后台把需要调起微 ...
- throws和throw的用法例子以及检测和非检查异常
throws E1,E2,E3 只是告诉程序这个方法可能会抛出这些个异常,方法的调用者可能要处理这些异常.而这些异常E1,E2,E3可能是该函数体产生的. 而throw是明确之处这个地方要抛出这个异常 ...
- scala学习手记6 - 字符串与多行原始字符串
scala中的字符串类就是java中的java.lang.String类.不过scala也为String提供了一个富封装类:scala.runtime.RichString. scala可以将java ...
- 使用springmvc报错Required int parameter 'age' is not present
仔细检查jsp代码 <a href="springmvc/testRequestParam?username=atguigu$age=11">Test RequestP ...
- 将hibernate.cfg.xml文件都放到spring中时报错
报错如下所示: 私以为是配置文件出现问题了. <?xml version="1.0" encoding="UTF-8"?> <beans xm ...