poj3415_Common Substrings
题意
给定两个字符串,求长度大于等于k的公共子串数。
分析
- 将两个字符串中间加个特殊字符拼接,跑后缀数组。
- 将题目转化为对每一个后缀求\(\sum_{j=1}^{i-1}lcp(i,j)\),且后缀\(i\)和\(j\)属于不同字符串。
- 由于\(lcp\)只跟\(h\)数组的区间最小值有关,因此对于单调递减的\(h[i]\)我们可以合并贡献和个数,维护一个单调栈。
- 分别统计\(a\)串对\(b\)的贡献和\(b\)串对\(a\)的贡献。
代码
#include <cstdio>
#include <algorithm>
#include <cstring>
using namespace std;
typedef long long ll;
const int N=3e5+50;
char a[N],b[N],s[N];
int sa[N],rk[N],h[N];
int t[N],t2[N],c[N];
int al,bl,n,k;
void build(int n,int m){
n++;
int *x=t,*y=t2;
for(int i=0;i<m;i++){
c[i]=0;
}
for(int i=0;i<n;i++){
c[x[i]=s[i]]++;
}
for(int i=1;i<m;i++){
c[i]+=c[i-1];
}
for(int i=n-1;i>=0;i--){
sa[--c[x[i]]]=i;
}
for(int k=1;k<=n;k*=2){
int p=0;
for(int i=n-k;i<n;i++){
y[p++]=i;
}
for(int i=0;i<n;i++){
if(sa[i]>=k){
y[p++]=sa[i]-k;
}
}
for(int i=0;i<m;i++){
c[i]=0;
}
for(int i=0;i<n;i++){
c[x[y[i]]]++;
}
for(int i=1;i<m;i++){
c[i]+=c[i-1];
}
for(int i=n-1;i>=0;i--){
sa[--c[x[y[i]]]]=y[i];
}
swap(x,y);
p=1;
x[sa[0]]=0;
for(int i=1;i<n;i++){
x[sa[i]]=y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
}
if(p>=n){
break;
}
m=p;
}
n--;
for(int i=0;i<=n;i++){
rk[sa[i]]=i;
}
int k=0;
for(int i=0;i<n;i++){
if(k){
k--;
}
int j=sa[rk[i]-1];
while(s[i+k]==s[j+k]){
k++;
}
h[rk[i]]=k;
}
}
void debug(){
for(int i=1;i<=n;i++){
for(int j=sa[i];j<n;j++){
printf("%c",s[j]);
}
printf("\n");
}
for(int i=1;i<=n;i++){
printf("%d ",sa[i]);
}
printf("\n");
for(int i=0;i<n;i++){
printf("%d ",rk[i]);
}
printf("\n");
for(int i=1;i<=n;i++){
printf("%d ",h[i]);
}
printf("\n");
}
//答案就是对任意两个不同后缀a[i...]和b[j...]的sum(lcp(ai,bj)-k+1)
//两个单调栈,一个维护h[i],一个维护贡献之和
ll he[N],ct[N];
ll solve(){
//考虑用单调栈优化到O(n),即对于每一个后缀求与前面后缀的lcp之和,不重不漏
ll ans=0;
//当前后缀与前面每个后缀的lcp之和
//由性质可知,当前后缀和前面某一个后缀的lcp应该是之间的h[i]最小值
//因此可以将递减的h[i]合并为最小的那个h[min]*cnt
ll sum=0;
int tp=0;
for(int i=2;i<=n;i++){
if(h[i]<k){
tp=0;
sum=0;
continue;
}
ll cnt=0;
//维护单调栈,由于lcp只跟区间h最小值有关,将所有栈顶大于当前h[i]的都合并
while(tp && he[tp]>h[i]){
//减去无效栈顶的贡献(h[i]-k+1)
sum-=(he[tp]-k+1)*ct[tp];
//暂时累计cnt,存储到新的栈顶
cnt+=ct[tp];
//栈顶出栈
tp--;
}
//入栈,保持单调性
he[++tp]=h[i];
if(sa[i-1]<al) {
//有效贡献的串,个数加1
cnt++;
}
ct[tp]=cnt;
//累加栈顶贡献
sum+=(he[tp]-k+1)*ct[tp];
if(sa[i]>al){
//将当前累加的贡献加到答案中,即b串后缀与前面所有a串后缀的lcp之和
ans+=sum;
}
}
tp=sum=0;
for(int i=2;i<=n;i++){
if(h[i]<k){
tp=0;
sum=0;
continue;
}
ll cnt=0;
while(tp && he[tp]>h[i]){
sum-=(he[tp]-k+1)*ct[tp];
cnt+=ct[tp];
tp--;
}
if(sa[i-1]>al){
he[++tp]=h[i];
ct[tp]=cnt+1;
sum+=(he[tp]-k+1)*ct[tp];
}else{
he[++tp]=h[i];
ct[tp]=cnt;
sum+=(he[tp]-k+1)*ct[tp];
}
//累加b串后缀与前面所有a串后缀的lcp之和
if(sa[i]<al){
ans+=sum;
}
}
return ans;
}
int main(){
// freopen("in.txt","r",stdin);
while(~scanf("%d",&k) && k){
scanf("%s",a);
scanf("%s",b);
al=strlen(a);
bl=strlen(b);
for(int i=0;i<al;i++){
s[i]=a[i];
}
s[al]='~';
for(int i=0;i<bl;i++){
s[al+1+i]=b[i];
}
n=al+bl+1;
s[n]='\0';
build(n,300);
// debug();
ll ans=solve();
printf("%lld\n",ans);
}
return 0;
}
poj3415_Common Substrings的更多相关文章
- [LeetCode] Unique Substrings in Wraparound String 封装字符串中的独特子字符串
Consider the string s to be the infinite wraparound string of "abcdefghijklmnopqrstuvwxyz" ...
- Leetcode: Unique Substrings in Wraparound String
Consider the string s to be the infinite wraparound string of "abcdefghijklmnopqrstuvwxyz" ...
- CSU-1632 Repeated Substrings (后缀数组)
Description String analysis often arises in applications from biology and chemistry, such as the stu ...
- CF451D Count Good Substrings (DP)
Codeforces Round #258 (Div. 2) Count Good Substrings D. Count Good Substrings time limit per test 2 ...
- LA4671 K-neighbor substrings(FFT + 字符串Hash)
题目 Source http://acm.hust.edu.cn/vjudge/problem/19225 Description The Hamming distance between two s ...
- 后缀数组---New Distinct Substrings
Description Given a string, we need to find the total number of its distinct substrings. Input T- nu ...
- Codeforces Round #258 D Count Good Substrings --计数
题意:由a和b构成的字符串,如果压缩后变成回文串就是Good字符串.问一个字符串有几个长度为偶数和奇数的Good字串. 分析:可知,因为只有a,b两个字母,所以压缩后肯定为..ababab..这种形式 ...
- SPOJ 694. Distinct Substrings (后缀数组不相同的子串的个数)转
694. Distinct Substrings Problem code: DISUBSTR Given a string, we need to find the total number o ...
- Codeforces Round #306 (Div. 2) A. Two Substrings 水题
A. Two Substrings Time Limit: 20 Sec Memory Limit: 256 MB 题目连接 http://codeforces.com/contest/550/pro ...
随机推荐
- (转)Vix_API 操作 VMware
对虚拟机(VMware Workstation)进行程序控制,查询了VMware官方网站的一些内容,但调试的时候还是出现很多问题. 刚开始想通过命令行的方式控制虚拟机,但总是存在一些问题,到现在也没搞 ...
- Y服务-你真的懂 Yaml 吗
目录 一.什么是 Yaml 二.Yaml 的语法 三.操作 Yaml A. 引入框架 B. 代码片段 C. 完整案例 参考文档 在Java 的世界里,配置的事情都交给了 Properties,要追溯起 ...
- jQuery甘特图/日程图/横道图/插件
基于JQ的一款灵活高效,支持自定义拓展的甘特图/日程图插件 支持月/周/小时等显示方式 支持拖动改变时间 展开与收起 添加/删除,刷新 节假日高亮 clicked,dblClicked,changed ...
- python字符编码-文件操作
字符编码 字符编码历史及发展 为什么有字符编码 ''' 原因:人们想要将数据存入计算机 计算机的能存储的信息都是二进制的数据 内存是基于电工作的,而电信号只有高低频两种,就用01来表示高低电频,所以计 ...
- [ PyQt入门教程 ] Qt Designer工具的布局管理
这节课很重要..界面整洁美观与否就看布局了..这里讲布局方法,至于设计的天赋与最终界面的美感那就看造化了.. 本文主要讲述Qt Designer工具实现界面控件布局管理,就是排列组合控件.包括水平布局 ...
- django第二次 (转自刘江)
除了我们前面说过的普通类型字段,Django还定义了一组关系类型字段,用来表示模型与模型之间的关系. 一.多对一(ForeignKey) 多对一的关系,通常被称为外键.外键字段类的定义如下: clas ...
- jquery插件——仿新浪微博限制输入字数的textarea
内容链接地址:http://www.cnblogs.com/jone-chen/p/5213851.html: <!DOCTYPE html> <html> <head& ...
- 【Android Studio】E/memtrack: Couldn't load memtrack module (No such file or directory)【待解决】
Android Studio 又遇到了问题--如下: 06-21 07:27:57.855 3232-3232/? E/memtrack: Couldn't load memtrack module ...
- 【iOS】"OS X"想要进行更改。键入管理员的名称和密码以允许执行此操作("OS X"想使用系统钥匙串)
今天真机调试的时候遇到了这个问题,如下图: 每次调试都要输入两次用户名和密码,好麻烦的说…… 关键时刻找到了这篇文章:"Mac OS X"想要进行更改.键入管理员的名称和密码以允许 ...
- 多线程编程(Linux C)
多线程编程可以说每个程序员的基本功,同时也是开发中的难点之一,本文以Linux C为例,讲述了线程的创建及常用的几种线程同步的方式,最后对多线程编程进行了总结与思考并给出代码示例. 一.创建线程 多线 ...