算法·理论：Manacher 笔记

$\text{Manacher}$ 来啦！

$\text{Manacher}$ 并没有什么前置知识，比 $\text{KMP}$ 简单多了。

前置处理

$\text{Manacher}$ 算法用于解决回文串相关问题，先看几个基本概念：回文中心、回文半径，这些看字面意思就能猜到。

还有一个重要问题：对于回文串，有长度为奇数或长度为偶数之分，即奇回文串和偶回文串。显然两种回文串需要分开进行处理，因为奇回文串的回文中心是一个字符，但偶回文串的回文中心是在两个相邻字符之间的，那我们看看能不能一致处理。

不难想到，既然偶回文串的的回文中心在两个相邻的字符之间，那我们不妨往每两个相邻字符之间插入一个虚拟的字符，比如 $\texttt{\#}$。

比如说对于偶回文串 $\texttt{abba}$，我们将他成 $\texttt{\#a\#b\#b\#a\#}$，这样这个偶回文串就变成了一个奇回文串，它的回文中心就变成 $\texttt{\#}$ 了！现在所有回文串都变成奇回文串了，接下来我们就可以一致处理了。

（至于头尾为何各放一个，后文再讲）

$\bf{Manacher}$ 算法

$\text{Manacher}$ 算法，可以在 $O(n)$ 的复杂度下处理出以每个字符（或两个字符之间）为回文中心的最大回文半径 $rad[]$。

先说明一下回文半径的定义：如果这个回文串的回文中心为 $o$，右端点为 $r$，那么这个回文串的回文半径 $rad=r-o+1$，也就是说回文半径要算上回文中心。

那么我们开始吧！首先思考朴素做法，显然我们可以枚举回文中心，再不断同时往两边扩展，扩展到不同时就找到了最远的左、右端点了，这个算法叫做中心扩展算法，时间复杂度 $O(n^2)$，代码就不放了，很好打。

同样注意到我们可以在此基础上二分回文半径，接着用子串哈希 $O(1)$ 比较，时间复杂度降到 $O(n\log n)$。

会议我们的 $\text{KMP}$ 算法是如何优化时间复杂度的：重复利用已知的信息，我在 $\text{KMP}$ 的文章中提过，这种思想叫做增量法，同时这也是 dp 思想的体现。

那我们考虑有什么信息可以重复利用？那显然是回文啊！那回文又有什么性质呢？对称啊！所以发现如果我们之前已经扩展到这个字符过，那前面就一定有和当前的字符对称的内容，那该字符显然也会拥有前面与它对称的字符的回文半径。

比如说字符串 $s=\texttt{babcbab}$，当我们枚举到 $s[6]$ 时（倒数第二个字符），显然这里已经被 $s[4]$（中间的 $\texttt{c}$）扩展过。由中点公式，与它对称的字符是 $s[2\times 4-6]=s[2]$，显然我们前面已经处理出 $rad[2]$ 了，$rad[2]=2$，所以 $rad[6]$ 就至少为 $2$ 了，当然还需要从回文半径为 $3$ 开始继续拓展。

但注意到我们只是对称到了前面计算过的点，并不保证能完全对称到整个回文子串，比如说对于字符串 $t=\texttt{babcbad}$，在枚举到 $s[6]$ 时（倒数第二个字符），虽然可以通过之前 $s[4]$（中间的 $\texttt{c}$）对称到 $s[2\times 4-6]=s[2]$，但是 $rad[6]$ 却不能到 $rad[2]$（自己看一下是不是），为什么呢？

因为虽然回文中心可以对称过来，但是 $s[4]$ 的 $rad$ 不够长，$s[7]$ 无法对称过去，所以这样做就无法保证整个回文串都能对称过去，解决方法就是只能利用以 $s[4]$ 为回文中心的最长回文串的右端点以内的信息，也就是说 $rad[6]$ 不能直接等于 $rad[2]$，还要跟在以 $s[4]$ 为回文中心的最长回文串的右端点以内的可扩展的最长长度取 $\min$。

形式化的，设我们所利用的回文串的回文中心为 $o$，右端点为 $r$，现在枚举到 $s[i]$ 且 $s[i]<r$（即可以利用是以前的信息），那么：

\[rad[i] \leftarrow\min(rad[2o-i],r-i+1)
\]

接着继续中心扩展即可。

解释：$\min$ 的一个参数是对称过去的字符所对应的 $rad$，由中点公式得到；而 $\min$ 的第二个参数是在 $r$ 及以内的可以扩展的最长长度，相信经过前面的讲解你应该也懂了。

那在枚举的过程中同时不断更新 $o$ 和 $r$ 即可。

看一眼代码：

int n;

char a[N],s[N<<1];

void manacher(){

	//  特殊处理

	int cur=0;

	s[0]='@';

	s[++cur]='#';

	for(int i=1;i<=n;i++) s[++cur]=a[i],s[++cur]='#';

	s[++cur]='!';

	n=cur-1;

	// 接下来就可以一致处理了

	for(int i=1,o=0,r=0;i<=n;i++){

		rad[i]=(i>r?1:min(rad[(o<<1)-i],r-i+1)); // 利用之前的信息

		while(s[i-rad[i]]==s[i+rad[i]]) rad[i]++; // 中心扩展

		if(i+rad[i]-1>r) o=i,r=i+rad[i]-1; // 更新 o 和 r

	}

}

a 是原串，s 是处理过后的字符串。

先说怎么算实际原串的以 $i$ 为回文中心的最长回文串的长度，其实就是 $rad[i]-1$（因为特殊处理后加了字符 $\texttt{\#}$），自己分类讨论一下 $s[i]$ 是或不是 $\texttt{\#}$，就容易推出这个式子了。

接着我们就可以解答上文的问题了，为什么头尾要各加一个 $\texttt{\#}$？举个例子，对于字符串 $\texttt{bac}$，其实应转换为 $\texttt{\#b\#a\#c\#}$，那么在枚举到 $\texttt{a}$ 时，实际上得到的回文串是 $\texttt{\#a\#}$，所以对于头尾的字符我们也应该做相同处理，于是前后各加一个 $\texttt{\#}$；或者你想想，如果两边不不加，那么 $rad=1$，于是以它为回文中心的最长回文串的长度就为 $rad-1=1-1=0$ 了，所以要这样修正。

那为什么头尾还要加 $\texttt{@}$ 和 $\texttt{!}$ 呢？是为了防止越界，或者说让扩展整个串的左右端点处停下来，比方说整个串就对称时，若枚举它的回文中心，那如果不往两边加两个不同的字符，那就会一直扩展下去，那就越界了。

其他的就没有什么好说的了，注意当 $i>r$ 时就直接从 $1$ 开始暴力中心扩展即可。

$\bf{Manacher}$ 复杂度

首先答案肯定是 $O(n)$ 的，依据是字符串算法全是线性的。

$\text{KMP}$ 知道怎么分析了，那就自己想想吧，答案在下面。

$\color{white}\text{同样唯一需要分析的就是这个 while,其他都显然是 O(n) 的。}$

$\color{white}\text{每个字符至多被从它后面暴力扩展到它一次，所以只会进行 O(n) 次 while。}$

$\color{white}\text{综上，实际复杂度 O(n)。}$

累啊！不过如此！

算法·理论：Manacher 笔记的更多相关文章

【C#代码实战】群蚁算法理论与实践全攻略——旅行商等路径优化问题的新方法
若干年前读研的时候,学院有一个教授,专门做群蚁算法的,很厉害,偶尔了解了一点点.感觉也是生物智能的一个体现,和遗传算法.神经网络有异曲同工之妙.只不过当时没有实际需求学习,所以没去研究.最近有一个这样 ...
python聚类算法实战详细笔记 (python3.6+(win10、Linux))
python聚类算法实战详细笔记 (python3.6+(win10.Linux)) 一.基本概念: 1.计算TF-DIF TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库 ...
Hash 算法与 Manacher 算法
目录前言简单介绍简述 Hash 冲突离散化基本结构普通 Hash 简述例题字符串 Hash 简单介绍核心思想基本运算二维字符串 Hash 例题兔子与兔子回文子串的最大长度后 ...
痞子衡嵌入式：超级下载算法(RT-UFL)开发笔记（2） - 识别当前i.MXRT型号
大家好,我是痞子衡,是正经搞技术的痞子.今天痞子衡给大家介绍的是超级下载算法开发笔记(2)之识别当前i.MXRT型号. 文接上篇 <超级下载算法(RT-UFL)开发笔记(1) - 执行在不同CM ...
痞子衡嵌入式：超级下载算法(RT-UFL)开发笔记（3） - 统一FlexSPI驱动访问
大家好,我是痞子衡,是正经搞技术的痞子.今天痞子衡给大家介绍的是超级下载算法开发笔记(3)之统一FlexSPI驱动访问. 文接上篇 <超级下载算法(RT-UFL)开发笔记(2) - 识别当前i. ...
痞子衡嵌入式：超级下载算法(RT-UFL)开发笔记（4） - 轮询Flash配置参数
大家好,我是痞子衡,是正经搞技术的痞子.今天痞子衡给大家介绍的是超级下载算法开发笔记(4)之轮询Flash配置参数. 文接上篇 <超级下载算法(RT-UFL)开发笔记(3) - 统一FlexSP ...
BLDC有感FOC算法理论及其STM32软硬件实现
位置传感器:旋转编码器 MCU:STM32F405RGT6 功率MOS驱动芯片:DRV8301 全文均假设在无弱磁控制的情况下 FOC算法理论首先,我们要知道FO ...
【算法】Manacher算法
最长回文串问题 manacher算法是用来求解最长回文串的问题.最长回文串的解法一般有暴力法.动态规划.中心扩展法和manacher算法. 暴力法的时间复杂度为$O(n^3)$,一般都会超时: 动 ...
「Manacher算法」学习笔记
觉得这篇文章写得特别劲,插图非常便于理解. 目的:求字符串中的最长回文子串. 算法思想考虑维护一个数组$r[i]$代表回文半径.回文半径的定义为:对于一个以$i$为回文中心的奇数回文子串,设其为闭区 ...
串的应用与kmp算法讲解--学习笔记
串的应用与kmp算法讲解 1. 写作目的平时学习总结的学习笔记,方便自己理解加深印象.同时希望可以帮到正在学习这方面知识的同学,可以相互学习.新手上路请多关照,如果问题还请不吝赐教. 2. 串的逻辑 ...

随机推荐

Spring扩展——Aware接口
Aware接口在Spring中有许多的Aware接口,提供给应用开发者使用,通过Aware接口,我们可以通过set的方式拿到我们需要的bean对象(包括容器中提供的一些对象,ApplicationC ...
三月二十四日安卓app打卡开发日志
目前打卡系统基本完成没有实现的功能有无法统计次数和连接本地数据库我全程连接的远程数据库 package com.example.test_four.utils; import java.sql ...
java8 lambda Predicate示例
import java.util.Arrays; import java.util.List; import java.util.function.Predicate; public class Pr ...
常用的jvm一些监控命令
一.jmap 查看堆内对象示例的统计信息 jmap -heap pid 描述:查看堆信息 jmap -histo:live pid | head -30 描述:显示堆中对象的统计信息命令:jmap ...
【原创】EtherCAT主站IgH解析(二)-- Linux/Windows/RTOS等多操作系统IgH EtherCAT主站移植指南
版权声明:本文为本文为博主原创文章,转载请注明出处.如有问题,欢迎指正.博客地址:https://www.cnblogs.com/wsg1100/ 前言目前,EtherCAT商用主站有:Aconti ...
CodeServer 不能粘贴
CodeServer 在没有SSL证书时, 由一浏览器的限制, 默认是不能粘贴的. 在局域网中, 如果不考虑安全性的话, 可以考虑直接把加密关掉, 就能复制粘贴了. 配置文件如下: cert: Tru ...
weui weui-switch 开关取值，设置默认状态
html <div class="weui-cell__ft"> <input class="weui-switch" type=" ...
在audio DSP中如何做软件固化
在audio DSP中, 软件的code和data主要放在3种不同的memory上,分别是片内的ITCM.DTCM和片外的memory(比如DDR)上.ITCM只能放code,DTCM只能放data, ...
洛谷P1832
#include<iostream> #include<utility> using namespace std; typedef long long ll; #define ...
推荐一款功能强大、界面优美的开源SSH跨平台终端软件WindTerm
WindTerm是一款开源免费且功能强大的终端软件,相比 MobaXterm自带中文支持.无论是在Windows.macOS还是Linux操作系统上,WindTerm都能提供出色的性能和稳定性.Win ...

算法·理论：Manacher 笔记

前置处理

\(\bf{Manacher}\) 算法

\(\bf{Manacher}\) 复杂度

算法·理论：Manacher 笔记的更多相关文章

随机推荐

热门专题