题意

给出两个长度小于等于2000的小写字母串,四个问题:

  • A的最短子串不是B的子串
  • A的最短子串不是B的子序列
  • A的最短子序列不是B的子串
  • A的最短子序列不是B的子序列

分析

虽然求的是不公共,但是这还是一个字符串的匹配问题,只不过是求匹配不到。

对于子串的匹配问题,可以使用后缀自动机。然而对于子序列的匹配问题,提出一种新的数据结构,称为子序列自动机

子序列自动机是一个能够跑出一个串的所有子序列的有限状态机,基本思路是每个点存每一种字符下一次出现位置的点,这样就可以保证跑出所有的子序列,并且状态数是\(O(n)\)的。子序列自动机的构建方法很简单,只要从后往前扫一次,维护每个字符最后出现的位置即可,所以它只支持在前端添加字符。

这样的子序列自动机的空间复杂度都是\(O(n|s|)\),其中\(s\)为字符集。构建的时间复杂度为\(O(n|s|)\),一次转移是\(O(1)\)的。

然而如果字符集过大,这样的复杂度很明显是不能被支持的。注意到这其实是一个从后往前扫的过程,不断地维护一个序列,所以我们可以把这个数组换成一个可持久化线段树,那么这样的空间复杂度,构建复杂的都是\(O(nlog|s|)\),一次转移就变成了\(O(log|s|)\)。

那么前两问就直接枚举A串的左端点,直接在两种自动机上跑一下即可。

后两问是与子序列有关的,所以可以考虑动态规划。设\(f[i]\)表示在自动机上走到\(i\)号点至少是多长的子序列,那么每次扫描每个点,往后转移一下即可。最终答案为\(f[null]\)(或程序中的\(f[0]\),即空状态)。

代码

  1. #include<cstdio>
  2. #include<cctype>
  3. #include<cstring>
  4. #include<algorithm>
  5. #define print(x) printf("%d\n",x==inf?-1:x)
  6. using namespace std;
  7. int read(int a[]) {
  8. char c=getchar();
  9. int len=0;
  10. for (;!isalpha(c);c=getchar());
  11. for (;isalpha(c);c=getchar()) a[++len]=c-'a'+1;
  12. return len;
  13. }
  14. const int maxn=2e3+10;
  15. const int maxc=27;
  16. const int inf=0x3f3f3f3f;
  17. int a[maxn],b[maxn];
  18. int n,m,f[maxn][maxn<<1];
  19. struct SAM {
  20. int t[maxn<<1][maxc],len[maxn<<1],link[maxn<<1],tot,last;
  21. SAM ():tot(1),last(1) {}
  22. void add(int x) {
  23. int nw=++tot,i;
  24. len[nw]=len[last]+1;
  25. for (i=last;i && !t[i][x];i=link[i]) t[i][x]=nw;
  26. if (i) {
  27. int p=t[i][x];
  28. if (len[p]==len[i]+1) link[nw]=p; else {
  29. int q=++tot;
  30. len[q]=len[i]+1;
  31. for (int j=i;j && t[j][x]==p;j=link[j]) t[j][x]=q;
  32. link[q]=link[p];
  33. link[p]=link[nw]=q;
  34. memcpy(t[q],t[p],sizeof t[p]);
  35. }
  36. } else link[nw]=1;
  37. last=nw;
  38. }
  39. void build(int a[],int n) {
  40. for (int i=1;i<=n;++i) add(a[i]);
  41. }
  42. int run(int a[],int n) {
  43. int now=1;
  44. for (int i=1;i<=n;++i) if (t[now][a[i]]) now=t[now][a[i]]; else return i;
  45. return inf;
  46. }
  47. int size() {
  48. return tot;
  49. }
  50. } sam;
  51. struct LAM {
  52. int t[maxn][maxc],aux[maxc],tot;
  53. void build(int a[],int n) {
  54. tot=n+1;
  55. for (int i=n;i;--i) {
  56. memcpy(t[i+1],aux,sizeof aux);
  57. aux[a[i]]=i+1;
  58. }
  59. memcpy(t[1],aux,sizeof aux);
  60. }
  61. int run(int a[],int n) {
  62. int now=1;
  63. for (int i=1;i<=n;++i) if (t[now][a[i]]) now=t[now][a[i]]; else {
  64. return i;
  65. }
  66. return inf;
  67. }
  68. int size() {
  69. return tot;
  70. }
  71. } lam;
  72. void up(int &x,int y) {
  73. x=min(x,y);
  74. }
  75. void one() {
  76. int ans=inf;
  77. for (int i=1;i<=n;++i)
  78. up(ans,sam.run(a+i-1,n-i+1));
  79. print(ans);
  80. }
  81. void two() {
  82. int ans=inf;
  83. for (int i=1;i<=n;++i)
  84. up(ans,lam.run(a+i-1,n-i+1));
  85. print(ans);
  86. }
  87. void three() {
  88. int ans=inf,dian=sam.size();
  89. memset(f,0x3f,sizeof f);
  90. f[0][1]=0;
  91. for (int i=1;i<=n;++i) {
  92. f[i][1]=0;
  93. for (int j=1;j<=dian;++j) f[i][j]=f[i-1][j];
  94. for (int j=1;j<=dian;++j) {
  95. up(f[i][sam.t[j][a[i]]],min(f[i-1][sam.t[j][a[i]]],f[i-1][j]+1));
  96. }
  97. }
  98. ans=f[n][0];
  99. print(ans);
  100. }
  101. void four() {
  102. int ans=inf,dian=lam.size();
  103. memset(f,0x3f,sizeof f);
  104. f[0][1]=0;
  105. for (int i=1;i<=n;++i) {
  106. f[i][1]=0;
  107. for (int j=1;j<=dian;++j) f[i][j]=f[i-1][j];
  108. for (int j=1;j<=dian;++j) {
  109. up(f[i][lam.t[j][a[i]]],min(f[i-1][lam.t[j][a[i]]],f[i-1][j]+1));
  110. }
  111. }
  112. ans=f[n][0];
  113. print(ans);
  114. }
  115. int main() {
  116. #ifndef ONLINE_JUDGE
  117. freopen("test.in","r",stdin);
  118. freopen("my.out","w",stdout);
  119. #endif
  120. n=read(a);
  121. m=read(b);
  122. sam.build(b,m);
  123. lam.build(b,m);
  124. one();
  125. two();
  126. three();
  127. four();
  128. return 0;
  129. }

bzoj4032-最短不公共子串的更多相关文章

  1. 【BZOJ4032】[HEOI2015]最短不公共子串(后缀自动机,序列自动机)

    [BZOJ4032][HEOI2015]最短不公共子串(后缀自动机,序列自动机) 题面 BZOJ 洛谷 题解 数据范围很小,直接暴力构建后缀自动机和序列自动机,然后直接在两个自动机上进行\(bfs\) ...

  2. bzoj4032/luoguP4112 [HEOI2015]最短不公共子串(后缀自动机+序列自动机上dp)

    bzoj4032/luoguP4112 [HEOI2015]最短不公共子串(后缀自动机+序列自动机上dp) bzoj Luogu 题解时间 给两个小写字母串 $ A $ , $ B $ ,请你计算: ...

  3. bzoj4032: [HEOI2015]最短不公共子串(SAM+DP)

    4032: [HEOI2015]最短不公共子串 题目:传送门 题解: 陈年老题良心%你赛膜爆嘎爷 当初做题...一眼SAM...结果只会两种直接DP的情况... 情况1: 直接设f[i][j] 表示的 ...

  4. BZOJ 4032: [HEOI2015]最短不公共子串

    4032: [HEOI2015]最短不公共子串 Time Limit: 10 Sec  Memory Limit: 256 MBSubmit: 446  Solved: 224[Submit][Sta ...

  5. 洛谷 P4112 [HEOI2015]最短不公共子串 解题报告

    P4112 [HEOI2015]最短不公共子串 题目描述 在虐各种最长公共子串.子序列的题虐的不耐烦了之后,你决定反其道而行之. 一个串的"子串"指的是它的连续的一段,例如bcd是 ...

  6. BZOJ 4032: [HEOI2015]最短不公共子串 后缀自动机 暴力

    4032: [HEOI2015]最短不公共子串 题目连接: http://www.lydsy.com/JudgeOnline/problem.php?id=4032 Description 在虐各种最 ...

  7. luoguP4112 [HEOI2015]最短不公共子串 SAM,序列自动机,广搜BFS

    luoguP4112 [HEOI2015]最短不公共子串 链接 luogu loj 思路 子串可以用后缀自动机,子序列可以用序列自动机. 序列自动机是啥,就是能访问到所有子序列的自动机. 每个点记录下 ...

  8. BZOJ4032[HEOI2015]最短不公共子串——序列自动机+后缀自动机+DP+贪心

    题目描述 在虐各种最长公共子串.子序列的题虐的不耐烦了之后,你决定反其道而行之. 一个串的“子串”指的是它的连续的一段,例如bcd是abcdef的子串,但bde不是. 一个串的“子序列”指的是它的可以 ...

  9. BZOJ4032:[HEOI2015]最短不公共子串(SAM)

    Description 在虐各种最长公共子串.子序列的题虐的不耐烦了之后,你决定反其道而行之. 一个串的“子串”指的是它的连续的一段,例如bcd是abcdef的子串,但bde不是. 一个串的“子序列” ...

  10. [BZOJ4032][HEOI2015]最短不公共子串(Trie+DP)

    在虐各种最长公共子串.子序列的题虐的不耐烦了之后,你决定反其道而行之——被它们虐. 操作一:对A,B分别建SAM,暴力BFS. 操作二:对B建序列自动机或SAM,A在上面暴力匹配. 操作三:对A,B建 ...

随机推荐

  1. MyBatis.Net 配置

    假设我们现在有这样的需求,要对学生信息进行管理 学生表有要以下要求 字段名称 数据类型 说明 stuNo 字符 学号,该列必填,为主键递增 stuName 字符 学生姓名,该列必填,要考虑姓氏可能是两 ...

  2. mfs分布式系统从理论简介到实战部署

    文章前面想说的话:这篇博客写出来真是有点累到了,本来昨天就基本就写好了,放在草稿里面,今天打开就没有了!!唉,就尼玛离我而去了,只有重写,然后中间虚拟机还“爆炸”重启又搞了一会,不容易呀!!希望各位博 ...

  3. mysql数据导到本地

    需求: 把mysql查询结果导出到txt(其他格式亦可),放在本地,供下一步使用 首先网上查了下,select * from driver into outfile 'a.txt'; 前面是你的sql ...

  4. Java如何调用shell脚本的

    有些时候会碰到这样的场景:java的功能里面要嵌入一个功能点,这个功能是通过是shell脚本实现的.这种时候就需要Java对脚本调用的支持了. 测试环境 Ubuntu16.04 i3-6100,12G ...

  5. 解决xampp启动mysql失败

    进入到注册表内 命令:regedit 进入到路径:计算机\HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\MySQL 修改路径为:" ...

  6. Keepalived两节点出现双VIP的情况

    一.现象 安装有keepalived的两节点服务器10.11.4.186/187,主要做高可用,设定VIP10.11.4.185. 首先启动10.11.4.186的keepalived服务,服务启动正 ...

  7. YAML 基础

    YAML 基础 简介 对象 数组 常量 引用 1.  简介 YAML 是专门用来写配置文件的语言,非常简洁和强大! 它的基本语法规则有: 大小写敏感: 使用缩进表示层级关系: 缩进时不允许使用 Tab ...

  8. [T-ARA][HUE]

    歌词来源:http://music.163.com/#/song?id=22704406 wa du seu mo geum to yo do ga tae 어딜가도 스페셜한게 없어 [eo-dil ...

  9. VisualSVN Server的迁移

    VisualSVN Server迁移涉及到两种情况: 第一种情况:VisualSVN Server没有更换电脑或者服务器,只是修改Server name. 第二种情况:当VisualSVN Serve ...

  10. 曾经我是一个只会excel的数据分析师,直到我遇到了……

    我是一个数据分析师. 准确来说我是一个当年只会excel数据透视表,就天不怕地不怕地来当数据分析师的人.当年的某一天,我的老板Q我: 小刘啊,我小姨子给了我一个全国市委书记的名单,你帮我看看,有什么规 ...