【链接】h在这里写链接


【题意】


    求两个串的长度大于等于k的公共子串个数。

    相同的重复计数。

【题解】


    先把两个字符串用一个分隔符分开。最好比出现的字符都大的一个数字。

    然后,对于这一个字符串,求出它的Height和Sa数组。

    然后,把height 数组【连续】大于等于k的,分成一组去考虑。

    (没有大于等于k了的话,显然子串的长度就不符合要求)



    如果我们在【这一组】里遇到了一个a串的后缀。

    那么显然,我们会在这个组里再找若干个b串的后缀。

    然后分别求出这个a串和这些b串的最长公共前缀temp,然后累加temp-k+1就好.



    但是这样实现的话,时间复杂度为O(n^2)



    有一个性质,就是任意两个后缀的最长公共前缀为它们之间(排名之间)的height的最小值。



    根据这个,用单调队列来做一个优化。

    对于连续的大于等于k的height值。

    i顺序扫过去。

        遇到的如果是a串,那么直接cnt累加height[i]-k+1,然后把它放到单调队列里面

        去,之后,如果再遇到a串的话,就看看是不是这个a串的height比之前的a串的height

        值更小,如果更小的话,就用新的,更小的height去取代旧的且比较大的height;

        (因为遇到了更小的,就说明,后面的b串如果要和a串递增答案,用的temp值就

        更小了,则cnt也会相应改变)

        这个过程就对应了,把单调队列的队尾的大的height给去掉。

        然后更新cnt;(cnt是下次遇到b串的时候累加答案的)

        然后把这个height[i]直接加到队列尾巴.

        因为遇到了一个新的a的后缀,所以后面的b如果要和这个a后缀做答案,

        肯定要从这个height[i]开始算最小值,后面如果有最小值,则后面再用

        上面的方法改就好。

        (之前虽然有更小的height,但是他们在[l,r]这个区间的左边。

        因此把它加到队列是没有问题的.



        如果遇到的是b串的后缀,那么,也应该用这个b串的后缀,来尝试改变一下单调

        队列里面的最小值,如果可改的话,那么他就取代了某些a串的height值了。还

        是一样,弹出队列尾巴比它大的。把这个新的加进去(因为是b的后缀,所以这个

        加入到队列尾巴以后,除非他取代了之前的a串的height,否则不计算个数),然

        后更改cnt的值。因为是b串,所以把之前的a串的cnt值累加进最后的答案就好。

        (所以这个cnt值,就相当于是预先算出来了前面的所有a的后缀,和下一个会遇

        到的b的后缀的答案的和)



    然后要反过来做一遍。

    即把b放在前面,遇到a累加b的答案。

    比如

    AABBAA

    (A和B代表了A和B的一个后缀)

    如果只做第一种

    3->5

    4->5

    3->6

    4->6

    这4种就会漏掉

【错的次数】


0

【反思】


转化模型:

给你n个数字ai,

每个数字属于A或属于B;

对于所有属于B的数字a[i]

求出j<i;

且a[j]属于A,

temp = ∑(min(a[j..i])-k+1)

对于所有的a[i]的temp值求和



【代码】

#include <cstdio>
#include <algorithm>
#include <cstring>
using namespace std; int k; const int N = 2e5;
const int MAX_CHAR = 255;//每个数字的最大值。
char s[N + 10];//如果是数字,就写成int s[N+10]就好,从0开始存
int Sa[N + 10], T1[N + 10], T2[N + 10], C[N + 10];
int Height[N + 10], Rank[N + 10];
int cnt[N + 10], dl[N + 10], tail; void build_Sa(int n, int m) {
int i, *x = T1, *y = T2;
for (i = 0; i<m; i++) C[i] = 0;
for (i = 0; i<n; i++) C[x[i] = s[i]]++;
for (i = 1; i<m; i++) C[i] += C[i - 1];
for (i = n - 1; i >= 0; i--) Sa[--C[x[i]]] = i;
for (int k = 1; k <= n; k <<= 1)
{
int p = 0;
for (i = n - k; i<n; i++) y[p++] = i;
for (i = 0; i<n; i++) if (Sa[i] >= k) y[p++] = Sa[i] - k;
for (i = 0; i<m; i++) C[i] = 0;
for (i = 0; i<n; i++) C[x[y[i]]]++;
for (i = 1; i<m; i++) C[i] += C[i - 1];
for (i = n - 1; i >= 0; i--) Sa[--C[x[y[i]]]] = y[i];
swap(x, y);
p = 1; x[Sa[0]] = 0;
for (i = 1; i<n; i++)
x[Sa[i]] = y[Sa[i - 1]] == y[Sa[i]] && y[Sa[i - 1] + k] == y[Sa[i] + k] ? p - 1 : p++;
if (p >= n) break;
m = p;
}
} void getHeight(int n)
{
int i, j, k = 0;
for (i = 1; i <= n; i++) Rank[Sa[i]] = i;
for (i = 0; i<n; i++) {
if (k) k--;
j = Sa[Rank[i] - 1];
while (s[i + k] == s[j + k]) k++;
Height[Rank[i]] = k;
}
} int main()
{
//freopen("F:\\rush.txt", "r", stdin);
while (~scanf("%d", &k) && k)
{
scanf("%s", s);
int l1 = strlen(s);
s[l1] = 'z' + 1;//分隔符
scanf("%s", s + l1 + 1);
int n = strlen(s);
s[n] = 0;//一个字符就链接完成了 //然后开始求后缀数组
build_Sa(n + 1, MAX_CHAR);//调用n+1
getHeight(n); //后缀数组求完了
//开始做算法 tail = 0;
long long temp = 0,ans =0;
for (int i = 2; i <= n-1; i++)//求连续的大于等于k的组,a->b
if (Height[i]>=k){
int num = 0;
while (tail >= 1 && Height[i] < dl[tail])
{//比Height[i]小的都去掉,因为区间最值肯定变小了
num+=cnt[tail];//加上a的后缀个数
temp -= 1LL*cnt[tail] * (dl[tail] - k + 1);
temp += 1LL*cnt[tail] * (Height[i] - k + 1);//改变累加值
tail--;
}
tail++;//把height[i]放到队列尾巴
dl[tail] = Height[i];
if (Sa[i-1] < l1)//是一个a串
{
temp += (Height[i] - k + 1);//累加它对后面的b的影响
cnt[tail] = num + 1;//把它看成一个整体了,前面的被他
//"吃掉的"都和它一样了。
}
else
{
//是一个b串
cnt[tail] = num;//他本身没有影响
}
if (Sa[i] > l1)//height[i]的影响范围只限于...i
//height[i+1]的影响范围是..i+1
//所以如果i是b串的话,它的height值已经算进去了
//可以想一下i=2时的运行情况。
{
ans += temp;
//i和j的lcp
//为height[i+1]..height[j]里面的最小值
}
}
else
{
tail = 0, temp = 0;
} temp = 0, tail = 0;
for (int i = 2; i <= n; i++)//求连续的大于等于k的组,b->a
if (Height[i] >= k) {
int num = 0;
while (tail >= 1 && Height[i] < dl[tail])
{//比Height[i]小的都去掉,因为区间最值肯定变小了
num += cnt[tail];//加上b的后缀个数
temp -= 1LL*cnt[tail] * (dl[tail] - k + 1);
temp += 1LL*cnt[tail] * (Height[i] - k + 1);//改变累加值
tail--;
}
tail++;//把height[i]放到队列尾巴
dl[tail] = Height[i];
if (Sa[i - 1] > l1)//是一个b串
{
temp += (Height[i] - k + 1);//累加它对后面的a的影响
cnt[tail] = num + 1;//把它看成一个整体了,前面的被他
//"吃掉的"都和它一样了。
}
else
{
//是一个a串
cnt[tail] = num;//他本身没有影响
}
if (Sa[i] < l1)//height[i]的影响范围只限于...i
//height[i+1]的影响范围是..i+1
//所以如果i是a串的话,它的height值已经算进去了
//可以想一下i=2时的运行情况。
{
ans += temp;
//i和j的lcp
//为height[i+1]..height[j]里面的最小值
}
}
else
{
tail = 0, temp = 0;
}
printf("%lld\n", ans);
}
return 0;
}

【POJ 3415】Common Substrings的更多相关文章

  1. 【POJ 3415】Common Substrings 长度不小于k的公共子串的个数

    长度不小于k的公共子串的个数,论文里有题解,卡了一上午,因为sum没开long long!!! 没开long long毁一生again--- 以后应该早看POJ里的Discuss啊QAQ #inclu ...

  2. 【POJ - 1458】Common Subsequence(动态规划)

    Common Subsequence Descriptions: A subsequence of a given sequence is the given sequence with some e ...

  3. 【POJ 1201】 Intervals(差分约束系统)

    [POJ 1201] Intervals(差分约束系统) 11 1716的升级版 把原本固定的边权改为不固定. Intervals Time Limit: 2000MS   Memory Limit: ...

  4. bzoj 2295: 【POJ Challenge】我爱你啊

    2295: [POJ Challenge]我爱你啊 Time Limit: 1 Sec  Memory Limit: 128 MB Description ftiasch是个十分受女生欢迎的同学,所以 ...

  5. 【链表】BZOJ 2288: 【POJ Challenge】生日礼物

    2288: [POJ Challenge]生日礼物 Time Limit: 10 Sec  Memory Limit: 128 MBSubmit: 382  Solved: 111[Submit][S ...

  6. BZOJ2288: 【POJ Challenge】生日礼物

    2288: [POJ Challenge]生日礼物 Time Limit: 10 Sec  Memory Limit: 128 MBSubmit: 284  Solved: 82[Submit][St ...

  7. BZOJ2293: 【POJ Challenge】吉他英雄

    2293: [POJ Challenge]吉他英雄 Time Limit: 1 Sec  Memory Limit: 128 MBSubmit: 80  Solved: 59[Submit][Stat ...

  8. BZOJ2287: 【POJ Challenge】消失之物

    2287: [POJ Challenge]消失之物 Time Limit: 10 Sec  Memory Limit: 128 MBSubmit: 254  Solved: 140[Submit][S ...

  9. BZOJ2295: 【POJ Challenge】我爱你啊

    2295: [POJ Challenge]我爱你啊 Time Limit: 1 Sec  Memory Limit: 128 MBSubmit: 126  Solved: 90[Submit][Sta ...

随机推荐

  1. es7 --- 新特性

    ES7只有2个特性: includes() 指数操作符 不使用ES7 使用indexOf()验证数组中是否存在某个元素,这时需要根据返回值是否为-1来判断: let arr = ['react', ' ...

  2. html元素的分类有哪些?

    今天零度给大家讲一下基本的html元素分类: HTML元素的分类其实主要有两种元素构成——块级元素和内联元素. html元素的分类有块级元素和行内元素 一.块级元素(block)的特点: 1.总是在新 ...

  3. Android自定义组件系列【13】——Android自定义对话框如此简单

    在我们的日常项目中很多地方会用到对话框,但是Android系统为我们提供的对话框样子和我们精心设计的界面很不协调,在这种情况下我们想很自由的定义对话框,或者有的时候我们的对话框是一个图片,没有标题和按 ...

  4. 转 C#:使用MD5对用户密码加密与解密

    C#中常涉及到对用户密码的加密于解密的算法,其中使用MD5加密是最常见的的实现方式.本文总结了通用的算法并结合了自己的一点小经验,分享给大家. 一.使用16位.32位.64位MD5方法对用户名加密 1 ...

  5. windows下go语言环境

    1  liteIDE ,随便装哪儿都行 2  GO语言包 安装  ,我安装到了 c:\go  (顺便给个地址下载地址  https://golang.org/dl/  ) 3  GCC编译器 安装,同 ...

  6. CF 843 A. Sorting by Subsequences

    A. Sorting by Subsequences You are given a sequence a1, a2, ..., an consisting of different integers ...

  7. 今日SGU 5.2

    SGU123 题意:求和 收获:无 #include<bits/stdc++.h> #define de(x) cout<<#x<<"="< ...

  8. smarty模板引擎(一)基础知识

    一.基本概念 1.什么是mvc?     mvc是一种开发模式,核心思想是:数据的输入.数据的处理.数据显示的强制分离. 2.什么是smarty?     smarty是一个php的模板引擎.更明白的 ...

  9. 跟着辛星用PHP的反射机制来实现插件

    我的博文的前一篇解说了PHP的反射机制是怎么回事,假设读者还不清楚反射机制,能够搜索下或者看我的博文,都是不错的选择.我们開始解说一下怎么用PHP来实现插件机制.所谓插件机制.就是我们定义一个接口.即 ...

  10. IAR FOR STM8 学习笔记 IAR工程的建立

    STM8是ST意法半导体针对工业应用和消费电子开发而推出的8位单片机. 每种MCU都有自身的优点与缺点,与其它8-bit MCU相比,STM8 8-bit MCU最大的特点是: · 内核: o 最高f ...