SAM求多个串的最长公共子串
又学到一个\(SAM\)的新套路QvQ
思路
考虑用其中的一个串建个\(SAM\),然后用其他的串在上面匹配,匹配时更新答案
首先有一个全局变量\(len\),表示当前已匹配的长度。假设目前在点\(u\),转移方式如下(根节点为\(1\)):
如果没有对应的转移边,就走后缀连接,\(u=suflink(u)\),并令\(len=maxlen(suflink(u))\)。否则走对应的转移边,同时\(len++\)。如果一直没有对应的转移边,即到最后发现\(u=0\),就把\(u\)置为\(1\),\(len\)置为\(0\),并开始下个字符的匹配
开一个数组\(mx\)记录每个结点被匹配时的\(len\)最大是多少,全部匹配完后还要拓扑排序一遍,把每个结点的\(mx\)上传给其\(parent\ tree\)上的祖先。对于一个结点\(u\),它所代表的\(lcs\)长度为每个字符串匹配完后\(mx\)中的最小值,每次更新一下就行了
代码
#include <bits/stdc++.h>
using namespace std;
#define N 100000
int m, n, root = 1, nid = 1, last = 1, maxlen[2*N+5], ch[2*N+5][26], link[2*N+5], mx[2*N+5], mn[2*N+5], len;
int tmp[2*N+5], a[2*N+5];
void insert(int c) {
int cur = ++nid;
maxlen[cur] = maxlen[last]+1;
while(last && !ch[last][c]) ch[last][c] = cur, last = link[last];
if(!last) link[cur] = root;
else {
int p = last, q = ch[last][c];
if(maxlen[q] == maxlen[p]+1) link[cur] = q;
else {
int clone = ++nid;
maxlen[clone] = maxlen[p]+1;
for(int i = 0; i < 26; ++i) ch[clone][i] = ch[q][i];
link[clone] = link[q]; link[q] = link[cur] = clone;
while(p && ch[p][c] == q) ch[p][c] = clone, p = link[p];
}
}
last = cur;
}
void radixSort() {
memset(tmp, 0, sizeof tmp);
for(int i = 1; i <= nid; ++i) tmp[maxlen[i]]++;
for(int i = 1; i <= m; ++i) tmp[i] += tmp[i-1];
for(int i = 1; i <= nid; ++i) a[tmp[maxlen[i]]--] = i;
for(int i = nid; i >= 1; --i)
mx[link[a[i]]] = max(mx[link[a[i]]], min(maxlen[link[a[i]]], mx[a[i]])), mn[a[i]] = min(mn[a[i]], mx[a[i]]);
}
void calc(char *s) {
n = strlen(s);
memset(mx, 0, sizeof mx);
int u = root;
len = 0;
for(int i = 0; i < n; ++i) {
while(u && !ch[u][s[i]-'a']) u = link[u], len = maxlen[u];
if(!u) u = root;
else {
u = ch[u][s[i]-'a'];
len++;
mx[u] = max(mx[u], len);
}
}
radixSort();
}
int main() {
char s[N+5];
scanf("%s", s);
m = strlen(s);
for(int i = 0; i < m; ++i) insert(s[i]-'a');
memset(mn, 0x3f, sizeof mn);
while(~scanf("%s", s)) calc(s);
int ans = 0;
for(int i = 1; i <= nid; ++i) ans = max(ans, mn[i]);
printf("%d\n", ans);
return 0;
}
例题
SP1811
SP1812
SP10570
[SDOI2008]Sandy的卡片
SAM求多个串的最长公共子串的更多相关文章
- SPOJ 1811 Longest Common Substring(求两个串的最长公共子串 || 或者n个串)
http://www.spoj.com/problems/LCS/ 题目:求两个串的最长公共子串 参考:https://www.cnblogs.com/autoint/p/10345276.html: ...
- SPOJ 1811 Longest Common Substring (后缀自动机第一题,求两个串的最长公共子串)
题目大意: 给出两个长度小于等于25W的字符串,求它们的最长公共子串. 题目链接:http://www.spoj.com/problems/LCS/ 算法讨论: 二分+哈希, 后缀数组, 后缀自动机. ...
- 多个串的最长公共子串 SPOJ - LCS2 后缀自动机
题意: 求多个串的最长公共子串 这里用的是O(n)的后缀自动机写法 我后缀数组的专题有nlog(n)写法的 题解: 对于其中的一个串建立后缀自动机 然后对于后缀自动机上面的每一个节点求出每一个节点最长 ...
- 【poj1226-出现或反转后出现在每个串的最长公共子串】后缀数组
题意:求n个串的最长公共子串,子串出现在一个串中可以是它的反转串出现.总长<=10^4. 题解: 对于每个串,把反转串也连进去.二分长度,分组,判断每个组. #include<cstdio ...
- SPOJ LCS2 多个串的最长公共子串
这里串最多有10个,找所有串的最长公共子串 这里后缀自动机做,以第一个串建立后缀自动机,后面的串一个个去匹配,每次得到当前串在可到达状态上所能得到的最长后缀长度 拿所有串匹配后得到的结果进行计算 #i ...
- 求两个字符串的最长公共子串——Java实现
要求:求两个字符串的最长公共子串,如“abcdefg”和“adefgwgeweg”的最长公共子串为“defg”(子串必须是连续的) public class Main03{ // 求解两个字符号的最长 ...
- [URAL-1517][求两个字符串的最长公共子串]
Freedom of Choice URAL - 1517 Background Before Albanian people could bear with the freedom of speec ...
- POJ 2774 求两个串的最长公共前缀 | 后缀数组
#include<cstdio> #include<algorithm> #include<cstring> #define N 200005 using name ...
- [SPOJ1812]Longest Common Substring II 后缀自动机 多个串的最长公共子串
题目链接:http://www.spoj.com/problems/LCS2/ 其实两个串的LCS会了,多个串的LCS也就差不多了. 我们先用一个串建立后缀自动机,然后其它的串在上面跑.跑的时候算出每 ...
随机推荐
- css3 动画 总结
原来的时候写过一个小程序,里面有一个播放背景音乐的按钮(也是一个圆形的图片),它是一直在旋转的,当我们点击这个按钮的可以暂停或者播放背景音乐.当初的这个动画,是同事自己写的,我看到的时候以为是他在上面 ...
- 02 入门 - ASP.NET MVC 5 概述
目录索引:<ASP.NET MVC 5 高级编程>学习笔记 本篇内容: 一.One ASP.NET 二.新的Web项目体验 三.ASP.NET Identity 四.Bootstrap 模 ...
- 剑指前端(前端入门笔记)——Date类型
Date类型 ECMAScript中的Date类型是在早期Java中的java.util.Date类基础上构建的.为此,Date类型使用自UTC(国际协调时间)1970年1月1日午夜(零时)开始经过的 ...
- Docker的使用
Ubuntu16.04+ 在Ubuntu系统中安装较为简单,官方提供了脚本供我们进行安装. sudo apt install curl curl -fsSL get.docker.com -o get ...
- 【esri-loader】帮助文档翻译 part1 是什么,怎么安装,为什么要用它
是什么 esri-loader是一个JavaScript库(包/模块,Web模块化编程的概念),用于在非Dojo框架的Web页面中加载ArcGIS API for JavaScript 3.x或4.x ...
- Android探究之View的绘制流程
Android中Activity是作为应用程序的载体存在,代表着一个完整的用户界面,提供了一个窗口来绘制各种视图,当Activity启动时,我们会通过setContentView方法来设置一个内容视图 ...
- rabbitmq之确保消息不丢失
1.背景引入 在使用消息中间件(rabbitmq)时,令开发者最头痛的就是防止消息丢失问题,而消息丢失可能发生的位置主要为三种,分别为(1)消息发送到MQ中消费者消费未成功时突然宕机:(2)消息发送到 ...
- 【原】使用IDEA创建Maven工程时提示"...xxx/pom.xml already exists in VFS"的解决
问题:使用IDEA创建Maven工程时提示"...xxx/pom.xml already exists in VFS",怎么办? 解决:如果只是删除工程,还会有这样的提示.说到底, ...
- mysql 高级
Sql优化: 1.SELECT语句中避免使用 *, 尽量根据业务需求按字段进行查询 举例:如果表中有个字段用的是clob或者是blob这种大数据字段的话, 他们的查询应该根据业务需要来进行指定字段的查 ...
- Java基础系列--01_基础类型
J2SE.J2ME.J2EE分别指什么? J2SE 基础版,桌面应用. J2ME 微型版,手机开发.(android,ios) J2EE 企业版,所有浏览器访问的应用程序. 注意:JDK5以后改名 J ...