牛客网多校训练第一场 I - Substring(后缀数组 + 重复处理)
链接:
https://www.nowcoder.com/acm/contest/139/I
题意:
给出一个n(1≤n≤5e4)个字符的字符串s(si ∈ {a,b,c}),
求最多可以从n*(n+1)/2个子串中选出多少个子串,使得它们互不同构。
同构是指存在一个映射f,使得字符串a的每个字符都可以映射成字符串b的对应字符。
例如ab与ac、ba、bc、ca、cb都是同构的。
分析:
以字符串abba为例:
现在只考虑这个字符串的2个子串ab和ba,如果不考虑重构,有2个子串,否则,只有1个子串。
这时,我们可以用全排列枚举出所有重构的字符串:
abba
acca
baab
bccb
caac
cbbc
由于每一个串都有2个子串,所以上面的6个同构串共有12个子串。
如果去掉重复的子串,则最终会剩下6个互不相同的子串。
即第一个字符串abba的ab被第三个字符串baab的ab消掉了,
第二个字符串acca的ac被第五个字符串caac的ac消掉了......
可以发现,剩下的6个子串正是ab的6种同构。
所以我们可以把一个字符串的六种同构拼接在一起,然后用后缀数组求出重复的子串个数height。
为了避免拼接的首尾字符对结果产生影响,要在拼接的每一段后面每次都加上一个新的字符。
设6个同构串的所有子串个数(6*(n*(n+1)/2))为sum。
则(sum-height)/6就是一个字符串里互不重构的子串个数。
但还有一个特殊情况:
只考虑字符串aaabbb的两个子串aaa和bbb。
如果采取上面的做法,最终会留下3个互不相同的子串aaa、bbb和ccc,即重复的子串个数为9。
这时答案是(12-9)/6=0,很显然这样是错误的。
原因是aaa的同构子串只有3种而不是6种,即单一字符的字符串的每个同构串都被多减了一次。
这时,我们可以找出一个字符串里最长的单一字符的字符串str,设它的长度为most。
因为比str短的单一字符的字符串都是str的一部分的重构,所以不需要考虑。
则正确的答案应该是(sum - height + 3*most)/6。(注意例子里aaa的长度视为1而不是3)
代码:
#include <cstdio>
#include <algorithm>
using namespace std; const int MAXS = 1e6 + ;
int sa[MAXS], mem[MAXS], mem2[MAXS], amt[MAXS]; // sa:后缀数组
void build_sa(char* s, int n, int m) { // n:字符串s的长度,每个字符值须小于m
mem[n] = mem2[n] = -;
int i, *x = mem, *y = mem2;
for(i = ; i < m; i++) amt[i] = ;
for(i = ; i < n; i++) amt[x[i]=s[i]]++;
for(i = ; i < m; i++) amt[i] += amt[i-];
for(i = n-; i >= ; i--) sa[--amt[x[i]]] = i;
for(int k = ; k <= n; k <<= ) {
int p = ;
for(i = n-k; i < n; i++) y[p++] = i;
for(i = ; i < n; i++) if(sa[i] >= k) y[p++] = sa[i]-k;
for(i = ; i < m; i++) amt[i] = ;
for(i = ; i < n; i++) amt[x[y[i]]]++;
for(i = ; i < m; i++) amt[i] += amt[i-];
for(i = n-; i >= ; i--) sa[--amt[x[y[i]]]] = y[i];
int* t = x; x = y; y = t;
p = ; x[sa[]] = ;
for(i = ; i < n; i++)
x[sa[i]] = y[sa[i-]]==y[sa[i]]&&y[sa[i-]+k]==y[sa[i]+k]?p-:p++;
if(p >= n) break;
m = p;
}
}
int idx[MAXS], height[MAXS]; // height:sa[i-1]与sa[i]的最长公共前缀
void get_height(char* s, int n) { // n:字符串s的长度
for(int i = ; i < n; i++) idx[sa[i]] = i;
for(int k = , i = ; i < n; i++) {
if(idx[i] - < ) continue;
if(k) k--;
int j = sa[idx[i]-];
while(s[i+k] == s[j+k]) k++;
height[idx[i]] = k;
}
} char s[MAXS], os[MAXS]; int main() {
int n;
while(~scanf("%d%s", &n, os)) {
int p = , en = , a[] = {, , };
do {
for(int i = ; i < n; i++) s[p++] = a[os[i]-'a'];
s[p++] = en++;
} while(next_permutation(a, a+));
build_sa(s, p, );
get_height(s, p);
long long ans = 6LL * n*(n+)/;
for(int i = ; i < p; i++) ans -= height[i];
int most = , len = ;
for(int i = ; i <= n; i++) {
if(os[i] == os[i-]) len++;
else most = max(most, len), len = ;
}
printf("%lld\n", (ans + *most) / );
}
return ;
}
牛客网多校训练第一场 I - Substring(后缀数组 + 重复处理)的更多相关文章
- 牛客网多校训练第一场 J - Different Integers(树状数组 + 问题转换)
链接: https://www.nowcoder.com/acm/contest/139/J 题意: 给出n个整数的序列a(1≤ai≤n)和q个询问(1≤n,q≤1e5),每个询问包含两个整数L和R( ...
- 牛客网多校训练第一场 F - Sum of Maximum(容斥原理 + 拉格朗日插值法)
链接: https://www.nowcoder.com/acm/contest/139/F 题意: 分析: 转载自:http://tokitsukaze.live/2018/07/19/2018ni ...
- 牛客网多校训练第一场 E - Removal(线性DP + 重复处理)
链接: https://www.nowcoder.com/acm/contest/139/E 题意: 给出一个n(1≤n≤1e5)个整数(范围是1至10)的序列,求从中移除m(1≤m≤min(n-1, ...
- 牛客网多校训练第一场 D - Two Graphs
链接: https://www.nowcoder.com/acm/contest/139/D 题意: 两个无向简单图都有n(1≤n≤8)个顶点,图G1有m1条边,图G2有m2条边,问G2有多少个子图与 ...
- 牛客网多校训练第一场 B - Symmetric Matrix(dp)
链接: https://www.nowcoder.com/acm/contest/139/B 题意: 求满足以下条件的n*n矩阵A的数量模m:A(i,j) ∈ {0,1,2}, 1≤i,j≤n.A(i ...
- 牛客网多校训练第一场 A - Monotonic Matrix(Lindström–Gessel–Viennot lemma)
链接: https://www.nowcoder.com/acm/contest/139/A 题意: 求满足以下条件的n*m矩阵A的数量模(1e9+7):A(i,j) ∈ {0,1,2}, 1≤i≤n ...
- 牛客网多校训练第二场D Kth Minimum Clique
链接:https://ac.nowcoder.com/acm/contest/882/D来源:牛客网 Given a vertex-weighted graph with N vertices, fi ...
- 牛客网多校训练第九场H Cutting Bamboos
题目链接:https://ac.nowcoder.com/acm/contest/889/H 题意:给出n颗竹子的高度,q次询问,每次询问给出l,r,x,y,每次选取[l,r]中的竹子,砍y次砍掉所有 ...
- 牛客网多校第3场C-shuffle card 平衡树或stl(rope)
链接:https://www.nowcoder.com/acm/contest/141/C 来源:牛客网 题目描述 Eddy likes to play cards game since there ...
随机推荐
- [转]【Oracle Database 12c新特性】32k varchar2 max_string_size
本文转自:https://blogs.oracle.com/askmaclean/entry/oracle_database_12c%E6%96%B0%E7%89%B9%E6%80%A7_32k_va ...
- [转]微信小程序填坑之路之使用localhost在本地测试
本文转自:http://www.wxappclub.com/topic/798
- express常用中间件
整理一下工作中经常使用到的Express中间件 config-lite: 读取配置文件 不同环境下配置文件使用 - Node实战 config-lite express-session: sessio ...
- C# Windows服务创建应用
创建项目 1.创建windows服务项目 2.右键点击Service1.cs,查看代码, 用于编写操作逻辑代码 3.OnStart函数在启动服务时执行,OnStop函数在停止服务时执行.代码中OnSt ...
- 六、cent OS其它常用命令
进入根目录下的laycloud的目录cd /laycloud 进入当前目录下的目录cd laycloud 查看某个目录下的内容ls /laycloud 查看当前目录下的内容ls 查看当前目录下的内容读 ...
- poj 2392 建塔(多重背包+不定上界)
http://blog.csdn.net/libin56842/article/details/9492351 这次比较理解那个!dp[j]是为了什么,因为是滚动数组,没有这个的话used那边会出问题 ...
- flask路由末端带斜线和不带斜线的区别
路由末端带有“/” app.route('/test/') 在浏览器中输入http://127.0.0.1:5000/test/ 和http://127.0.0.1:5000/test都能访问 路由末 ...
- 简单工厂模式的C++、Java实现
1.简单工厂模式UML UML如下: 图1. 简单工厂模式UML 2.C++实现 类视图如下: 图2. C++实现简单工厂模式类视图 其中,SimpleFactory实现为: Product * Si ...
- RegExp.prototype.exec()使用技巧
RegExp.prototype.exec() exec() 方法在一个指定字符串中执行一个搜索匹配.返回一个结果数组或 null. 如果你只是为了判断是否匹配(true或 false),可以使用 R ...
- IntelliJ IDEA 16创建Web项目
首先要理解一个概念:在IntelliJ IDEA中“new Project”相当于eclipse中的工作空间(Workspace),而“new Module”相当于eclipse中的工程(Projec ...