题目链接

题意:给定长度为n(n <= 1000)的只含小写字母的字符串,问字符串子串不重叠出现最少两次的不同子串个数;

input:

aaaa
ababcabb
aaaaaa
#
output
2
3
3
 
思路:套用后缀数组求解出sa数组和height数组,之后枚举后缀的公共前缀长度i,由于不能重叠,所以计数的是相邻height不满足LCP >= i的。
写写对后缀数组倍增算法的理解:
1.如果要sa数组对应的值也是1~n就需要在最后加上一个最小的且不出现的字符'#',里面y[]是利用sa数组对第二个关键字重新排序,由于使用的是基数排序,所以当前一次长度为k时相同的子串,在下一次长为2*k时,y排在前面的下标得到的sa是要小的;
 
2.在getHeight函数中,rk[i]:后缀i在sa中的排名;height[i]表示s[i] 与s[i-1]的公共前缀长度。且s[i] 与 s[j] 的值为 RMQ(min{ height[i+1]...height[j] }),加上i < j;同时可以借助辅助数组h[i] = height[rk[i]],得到h[i] >= h[i-1] + 1;这样使用递推就可以将求解height[]的时间复杂度降为O(n);
 
注意:在输入串s末尾加入字符之后 n = strlen(s) + 1;在求解rk[]时,sa[i]是从1开始的,sa[0] = '$';之后的求解height[]还是从0开始;细节
 
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int MAXN = ;
char s[MAXN];
int sa[MAXN],t[MAXN],t2[MAXN],c[MAXN],n;
void build_sa(int m,int n) // m为字符ASCII码的最大值+1;n = strlen(s) + 1;
{
int i,*x = t, *y = t2;
for(i = ;i < m; i++) c[i] = ;
for(i = ;i < n; i++) c[x[i] = s[i]]++;
for(i = ;i < m; i++) c[i] += c[i-];
for(i = n - ;i >= ; i--) sa[--c[x[i]]] = i;
for(int k = ;k <= n;k <<= ){
int p = ;
for(i = n - k;i < n;i++) y[p++] = i;
for(i = ;i < n;i++) if(sa[i] >= k) y[p++] = sa[i] - k; for(i = ;i < m;i++) c[i] = ;
for(i = ;i < n;i++) c[x[y[i]]]++;
for(i = ;i < m;i++) c[i] += c[i-];
for(i = n - ;i >= ;i--) sa[--c[x[y[i]]]] = y[i]; swap(x,y);
x[sa[]] = ;// 将字符彻底转变为序号;
for(i = ,p = ;i < n;i++)
x[sa[i]] = y[sa[i]] == y[sa[i-]] && y[sa[i]+k] == y[sa[i-]+k]?p-:p++;
if(p >= n) break;
m = p;
}
}
int rk[MAXN],height[MAXN];
void getHeight()
{
int i,j,k = ;
for(i = ;i <= n;i++) rk[sa[i]] = i; // rk[i]:后缀i在sa[]中的下标,从1开始
for(i = ;i < n;i++){
if(k) k--;
if(rk[i] == ) continue;
j = sa[rk[i] - ];
while(i+k<n && j+k<n && s[i+k] == s[j+k]) k++;
height[rk[i]] = k; // h[i] = height[rk[i]]; h[i] >= h[i-1] - 1;
}
}
int main()
{
while(scanf("%s",s) == && s[] != '#'){
ll ans = ;
n = strlen(s);
s[n] = '#';
build_sa('z'+,n+);
getHeight();
for(int i = ;i <= n/; i++){
int l = n+,r = -;
for(int j = ;j <= n;j++){
if(height[j] >= i){// 递推出最左最优的l,r;
r = max(r,max(sa[j],sa[j-]));
l = min(l,min(sa[j],sa[j-]));
}
else{
if(r-l >= i) ans++;
r = -,l = n+;
}
}
if(r-l >= i) ans++;
}
printf("%I64d\n",ans);
}
return ;
}
 

hdu 3518 Boring counting 后缀数组LCP的更多相关文章

  1. hdu 3518 Boring counting 后缀数组基础题

    Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Submission( ...

  2. hdu 3518 Boring counting 后缀数组

    题目链接 根据height数组的性质分组计算. #include <iostream> #include <vector> #include <cstdio> #i ...

  3. hdu 3518 Boring counting 后缀数组 height分组

    题目链接 题意 对于给定的字符串,求有多少个 不重叠的子串 出现次数 \(\geq 2\). 思路 枚举子串长度 \(len\),以此作为分界值来对 \(height\) 值进行划分. 显然,对于每一 ...

  4. 后缀数组 --- HDU 3518 Boring counting

    Boring counting Problem's Link:   http://acm.hdu.edu.cn/showproblem.php?pid=3518 Mean: 给你一个字符串,求:至少出 ...

  5. HDU 3518 Boring counting(后缀数组,字符处理)

    题目 参考自:http://blog.sina.com.cn/s/blog_64675f540100k9el.html 题目描述: 找出一个字符串中至少重复出现两次的字串的个数(重复出现时不能重叠). ...

  6. HDU 3518 Boring counting

    题目:Boring counting 链接:http://acm.hdu.edu.cn/showproblem.php?pid=3518 题意:给一个字符串,问有多少子串出现过两次以上,重叠不能算两次 ...

  7. hdu3518 Boring counting(后缀数组)

    Boring counting 题目传送门 解题思路 后缀数组.枚举每种长度,对于每个字符串,记录其最大起始位置和最小起始位置,比较是否重合. 代码如下 #include <bits/stdc+ ...

  8. HDOJ 题目3518 Boring counting(后缀数组,求不重叠反复次数最少为2的子串种类数)

    Boring counting Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others) ...

  9. poj 2774 Long Long Message 后缀数组LCP理解

    题目链接 题意:给两个长度不超过1e5的字符串,问两个字符串的连续公共子串最大长度为多少? 思路:两个字符串连接之后直接后缀数组+LCP,在height中找出max同时满足一左一右即可: #inclu ...

随机推荐

  1. cocos2d-x之MoonWarriors用c++实现

    玩了sample里面的cocos2d-html5的MoonWarriros,感觉效果做得挺不错的,但是源代码是javascript,鄙人又不会这门语言. github上也有别人贡献的c++代码,不过还 ...

  2. Android(java)学习笔记73:线程组的概述和使用

    Java中使用ThreadGroup来表示线程组,它可以对一批线程进行分类管理,Java允许程序直接对线程组进行控制. (1)默认情况下,所有的线程都属于主线程组. public final Thre ...

  3. mybatisGenerator 代码自动生成报错 Result Maps collection already contains value for BaseResultMap【转】

    由于mybatis简单易学,比起Hibername来,更容易上手,代码也能自动生成.这几天研究了下代码自动生成的,参考: http://0609xiaohua.iteye.com/blog/14535 ...

  4. 隐藏tabBar页面跳转后会再布局一次,

    隐藏tabBar有2种方式 1,在sourceController中隐藏目的控制器的tabBar - (void)prepareForSegue:(UIStoryboardSegue *)segue ...

  5. [改善Java代码]不同的场景使用不同的泛型通配符

    Java泛型支持通配符(Wildcard),可以单独使用一个"?"表示任意类,也可以使用extends关键字标识某一类(接口)的子类型,还可以使用super关键字标识某一类(接口) ...

  6. Java 自带性能监控工具:监视和管理控制台jconsole的使用

    关于JConsole工具的使用请参见:http://blog.csdn.net/defonds/article/details/45064297

  7. hdu 4455 动态规划

    思路:用sum[i]表示区间长度为i的不相同数的个数和,假使所有的数都不相同,那么sum[i]=sum[i-1]+n-i+1-later[i-1]; later[i-1]表示的是序列最后面的长度为i- ...

  8. New MVC World

    Note: /Controllers:controllers respond to input from the browser,decide what to do with it,and retur ...

  9. Git CMD - config: Get and set repository or global options

    命令参数 --get 获取指定的配置项. --global 对于写选项:全局配置,将参数配置于 ~/.gitconfig 而不是仓库目录下的 .git/config.对于读选项:只从 ~/.gitco ...

  10. 基于asp.net MVC 的服务器和客户端的交互(二)之获取Oauth 2.0认证权限

    基本Web API的ASP.NET的Oauth2认证 增加Token额外字段 增加Scope授权字段 持久化Token 设计Token的时间间隔 刷新Token后失效老的Token 自定义验证[重启I ...