FFT,NTT 笔记
FFT
简介
FFT是干啥的?它是用来加速多项式乘法的。我们平时经常求多项式乘法,比如\((x+1)(x+3)=(x^2+4x+3)\)。假设两个式子都是\(n\)项(不足的补0),那朴素的算法是\(O(n^2)\)的。
那么,我们能做到\(O(nlogn)\)做么?
前置知识
多项式点值表示
我们平常表达多项式,都是用系数表达的。当然,还有点值表达。用平面直角坐标系上的\(n\)个点,唯一确定一个(不超过)\(n-1\)次的多项式。它的一个特殊形式,就是两点确定一条直线。
点值转系数表达,你只需要解一个方程组就珂以了。(高斯消元,这样是\(O(n^3)\)的)
复数
复数的定义
这个很多人知道。定义\(i=\sqrt{-1}\),即虚数单位。形如\(a+bi\)的数就是复数(complex)。
复数\(a+bi\)的辐角:从\((0,0)\)到\((a,b)\)的线段和\(x\)轴的夹角。这个夹角,是顺时针方向的夹角。取值范围是\([0,360]\)。
复数的几何意义
在一维数轴上,我们把一个数乘以\(-1\),相当于旋转了\(180\)。
那么,我们把一个数乘以\(\sqrt{-1}\),相当于:乘两次是旋转\(180\)。所以,乘一次就是旋转\(90\),也就是竖起来了。“竖起来”,这个概念很好表示,就是\(y\)坐标。
那么,\(a+bi\)就相当于平面直角坐标系上的点\((a,b)\)。当然,你也珂以把它看成一个向量,从\((0,0)\)到\((a,b)\)。
复数的运算
复数的加法:\((a_1+b_1i)+(a_2+b_2i)=(a_1+a_2)+(b_1+b_2)i\)。(这样也就包含了减法的情况)
复数的乘法:\((a_1+b_1i)\times (a_2+b_2i)\)
我们把括号拆开,然后把\(i^2\)都变成\(-1\)(由\(i\)的定义)。易得,它等于:\((a_1a_2-b_1b_2)+(a_1b_2+a_2b_1)i\)
(n次)单位复根
满足\(x^n=1\)的所有复数解中,辐角最小且不为\(0\)的那个复数。记作\(w_n\)。不难发现,所有满足条件的\(x\),用向量表示后,把单位圆\(n\)等分。
举个栗子,\(n=6\)的时候,解的分布是这样的:
其中,\(\omega_n\)就是图中标出来的,辐角大于0且最小的那个向量。
单位复根的性质
- \(w_{2n}^{2k}=w_{n}^{k}\)(珂以把\(w_n^k\)看成是\(360\deg\times \dfrac{k}{n}\),这条证毕)
- \(w_n^{k+n/2}=-w_n^k\)。(这里\(n/2\)不取整,就是小数) (把\(n/2\)看成是转半圈,转半圈也就是\(x,y\)坐标都变负,这条也证毕)
正式开始!
上面不是说了点值表示么。对于两个用点值表示的多项式,只要把对应的点值乘起来即珂。
但是,我们要取\(n\)个点(DFT),每次\(O(n)\)求值,不是要\(O(n^2)\)了么?
而且,把点值转换成系数(插值,IDFT)的过程,不是要\(O(n^3)\)么?
因此,我们的主干思想是:利用单位复根的性质,巧妙的求值/插值,使得我们在\(O(nlogn)\)的时间内完成这些操作。
简图(远航之曲大佬的图):
DFT
就是快速带入点值的过程。
我们的多项式:\(A(x)=a_0x^0+a_1x^1+a_2x^2...+a_{n-1}x^{n-1}\)。其中\(a_0,a_1...a_n\)是系数(题目给定)。
接下来,我们设\(n=2^k\)。不足的地方用\(0\)补齐。
把它的系数按下表奇偶分组(指数还是顺序下来的):
\(A_0(x)=a_0x^0+a_2x^1+a_4x^2...+a_{n-2}x^{n/2-1}\)
\(A_1(x)=a_1x^0+a_3x^1+a_5x^2...+a_{n-1}x^{n/2-1}\)
易得\(A(x)=A_0(x^2)+xA_1(x^2)\)。
那么,我们代入\(x=w_n^0,w_n,w_n^2...w_{n}^{n-1}\)。
考虑求前面\(n/2\)个,然后直接得到后面\(n/2\)个。令\(k\in [0,n/2)\),则:
\(A(w_n^k)=A_0(w_n^{2k})+w_n^kA_1(w_n^{2k})\)
然后我们再代入\(w_n^{k+n/2}=-w_n^k\):
\(A(w_n^{k+n/2})=A_0(w_n^2k)-A_1(w_n^2k)\)
我们发现,\(w_n^{k+n/2}=-w_n^k\)。然而\(A_0,A_1\)里面是\(x^2\),所以取负不影响\(A_0\)和\(A_1\)的结果,只有\(A_1\)前面那一项有一个正负号的区别!
所以,我们求出前一半,就珂以\(O(n)\)求出后一半。
这样显然是\(O(nlogn)\)的。
DFT的实现优化
刚刚做完\(O(nlogn)\)的式子。但是,实现的时候,递归似乎太慢了,还不如暴力来的快。
我们观察一下,被奇偶分组后的下标。
(草 图)
转换一下二进制:
000 001 010 011 100 101 110 111
变成:
000 100 010 110 001 101 011 111
相当于每个二进制数位反过来了。
然后我们通过递推,推出最后的状态。然后不断合并,合并成答案。成功的把递归转化掉了。这样还是\(O(nlogn)\),但是快了很多!
IDFT
IDFT,就是我们已知一个点值表示的多项式,而且代入的点值还是\(w_n^0,w_n^1...w_n^{n-1}\)。
我们设出系数\(a_0,a_1..a_{n-1}\),列出方程:
a_0(w_n^0)^0+a_1(w_n^0)^1...+a_{n-1}(w_n^0)^{n-1}=A(w_n^0)\\
a_0(w_n^1)^0+a_1(w_n^1)^1...+a_{n-1}(w_n^1)^{n-1}=A(w_n^1)\\
...\\
a_0(w_n^{n-1})^0+a_1(w_n^{n-1})^1...+a_{n-1}(w_n^{n-1})^{n-1}=A(w_n^{n-1})\\
\end{cases}
\]
用矩阵表达:
(w_n^0)^0 & (w_n^0)^1 & ... & (w_n^0)^{n-1}\\
(w_n^1)^0 & (w_n^1)^1 & ... & (w_n^1)^{n-1}\\
...\\
(w_n^{n-1})^0 & (w_n^{n-1})^1 & ... & (w_n^{n-1})^{n-1}
\end{bmatrix}
\times
\begin{bmatrix}
a_0\\
a_1\\
.\\
.\\
.\\
a_{n-1}
\end{bmatrix}=
\begin{bmatrix}
A(w_n^0)\\
A(w_n^1)\\
.\\
.\\
.\\
A(w_n^{n-1})
\end{bmatrix}
\]
设这个式子是“珂朵莉IDFT①式”
然后设矩阵\(D\),\(D\)中的每一项和左边那个矩阵
(w_n^0)^0 & (w_n^0)^1 & ... & (w_n^0)^{n-1}\\
(w_n^1)^0 & (w_n^1)^1 & ... & (w_n^1)^{n-1}\\
...\\
(w_n^{n-1})^0 & (w_n^{n-1})^1 & ... & (w_n^{n-1})^{n-1}
\end{bmatrix}
\]
中对应位置上的项,都是倒数。
易证,\(D\times V=n\times I_n\),其中\(I_n\)是\(n\)阶单位矩阵。
那也就是,\(D=\dfrac{1}{n}V^{-1}\)
把“珂朵莉IDFT①式”中,左右两边同时乘一个\(D=\dfrac{1}{n}V^{-1}\)。
易得:
a_0\\
a_1\\
.\\
.\\
.\\
a_{n-1}
\end{bmatrix}=
\dfrac{1}{n}D
\begin{bmatrix}
A(w_n^0)\\
A(w_n^1)\\
.\\
.\\
.\\
A(w_n^{n-1})
\end{bmatrix}
\]
那么我们把矩阵\(V\)中,所有项取倒数,然后做一遍\(DFT\)即珂。最后记得除一个\(n\)。
模板题的代码
洛谷 3803
#include <bits/stdc++.h>
using namespace std;
namespace Flandre_Scarlet
{
#define N 3000006 //空间的理论下限
//2097153=2^21+1
#define real double
#define Pi (3.14159265358979323846264338)
#define F(i,l,r) for(int i=l;i<=r;++i)
#define D(i,r,l) for(int i=r;i>=l;--i)
#define Fs(i,l,r,c) for(int i=l;i<=r;c)
#define Ds(i,r,l,c) for(int i=r;i>=l;c)
#define MEM(x,a) memset(x,a,sizeof(x))
#define FK(x) MEM(x,0)
#define Tra(i,u) for(int i=G.Start(u),__v=G.To(i);~i;i=G.Next(i),__v=G.To(i))
#define p_b push_back
#define sz(a) ((int)a.size())
#define iter(a,p) (a.begin()+p)
void R1(int &x)
{
x=0;char c=getchar();int f=1;
while(c<'0' or c>'9') f=(c=='-')?-1:1,c=getchar();
while(c>='0' and c<='9') x=(x<<1)+(x<<3)+(c^48),c=getchar();
x=(f==1)?x:-x;
}
void Rd(int cnt,...)
{
va_list args;
va_start(args,cnt);
F(i,1,cnt)
{
int* x=va_arg(args,int*);R1(*x);
}
va_end(args);
}
struct cp{real R,I;}; //复数类
//R: 实部,a+bi中的a
//I:虚部,a+bi中的b
cp operator+(cp a,cp b){return (cp){a.R+b.R,a.I+b.I};}
cp operator-(cp a,cp b){return (cp){a.R-b.R,a.I-b.I};}
cp operator*(cp a,cp b){return (cp){a.R*b.R-a.I*b.I,a.R*b.I+a.I*b.R};}
int n,m;
cp a[N],b[N];
void Input()
{
Rd(2,&n,&m);
F(i,0,n) {int x;R1(x);a[i].R=x;}
F(i,0,m) {int x;R1(x);b[i].R=x;}
}
int r[N],lim;
void FFT(cp A[],int type)
//type=1: DFT
//type=-1: IDFT
{
F(i,0,lim) if (i<r[i]) swap(A[i],A[r[i]]);
for(int mid=1;mid<lim;mid<<=1) //合并区间的长度
//每次合并两个长度为mid的区间
{
cp Wn=(cp){cos(Pi/mid),type*sin(Pi/mid)};
// 单位圆上的坐标 (x,y) 满足 x^2+y^2=1
// 那么 x+yi 的逆就是 x-yi
// 很容易验证:(x+yi)(x-yi)=x^2-(yi)^2=x^2+y^2=1
for(int j=0;j<lim;j+=(mid<<1))
{
cp w=(cp){1,0}; //Wn^0
for(int k=0;k<mid;++k,w=w*Wn) //w:不断代入Wn^k
{
cp X=A[j+k],Y=w*A[j+mid+k];
//DFT的合并式子
A[j+k]=X+Y;
A[j+mid+k]=X-Y;
}
}
}
}
void Soviet()
{
int l=0;lim=1;
while(lim<=n+m) lim<<=1,++l;
F(i,0,lim) r[i]=(r[i>>1]>>1)|((i&1)<<(l-1));
FFT(a,1);FFT(b,1); //两个DFT
F(i,0,lim) a[i]=a[i]*b[i]; //点值乘法
FFT(a,-1); //IDFT
F(i,0,n+m) printf("%d ",(int)(a[i].R/lim+0.5)); //还要乘一个1/lim
//+0.5是取四舍五入
putchar('\n');
}
#define Flan void
Flan IsMyWife()
{
Input();
Soviet();
}
}
int main(){
Flandre_Scarlet::IsMyWife();
getchar();getchar();
return 0;
}
NTT
NTT本质上就是把\(FFT\)中的单位复根换成一个有相同性质的整数:原根。
只要记住\(998244353\)的原根是\(3\)即珂。
然后和\(FFT\)同样的方法去写就珂以了,也是DFT+IDFT。
就是把里面单位复根换成原根,一样写即可。
代码:
#include <bits/stdc++.h>using namespace std;
namespace Flandre_Scarlet
{
#define N 2666666
#define mod 998244353
#define Gi 332748118 //3^(-1) mod 998244353
#define int long long
#define F(i,l,r) for(int i=l;i<=r;++i)
#define D(i,r,l) for(int i=r;i>=l;--i)
#define Fs(i,l,r,c) for(int i=l;i<=r;c)
#define Ds(i,r,l,c) for(int i=r;i>=l;c)
#define MEM(x,a) memset(x,a,sizeof(x))
#define FK(x) MEM(x,0)
#define Tra(i,u) for(int i=G.Start(u),__v=G.To(i);~i;i=G.Next(i),__v=G.To(i))
#define p_b push_back
#define sz(a) ((int)a.size())
#define iter(a,p) (a.begin()+p)
void R1(int &x)
{
x=0;char c=getchar();int f=1;
while(c<'0' or c>'9') f=(c=='-')?-1:1,c=getchar();
while(c>='0' and c<='9') x=(x<<1)+(x<<3)+(c^48),c=getchar();
x=(f==1)?x:-x;
}
void Rd(int cnt,...)
{
va_list args;
va_start(args,cnt);
F(i,1,cnt)
{
int* x=va_arg(args,int*);R1(*x);
}
va_end(args);
}
int n,m;
int a[N],b[N];
void Input()
{
Rd(2,&n,&m);
F(i,0,n) R1(a[i]);
F(i,0,m) R1(b[i]);
}
int qpow_p(int a,int b,int m) //正数的快速幂
{
int r=1;
while(b)
{
if (b&1) r=r*a%m;
a=a*a%m,b>>=1;
}
return r;
}
int qpow(int a,int b,int m) //支持负指数的快速幂(就是先求快速幂,然后求一个逆元)
{
if (b==0) return 1;
else if (b<0) return qpow_p(qpow_p(a,-b,m),m-2,m);
else return qpow_p(a,b,m);
}
int r[N],lim;
void NTT(int A[N],int type)
{
F(i,0,lim) if (i<r[i]) swap(A[i],A[r[i]]);
for(int mid=1;mid<lim;mid<<=1)
{
int Wn=qpow(qpow(3,type,mod),(mod-1)/(mid<<1),mod);
for(int j=0;j<lim;j+=(mid<<1))
{
int w=1;
for(int k=0;k<mid;k++,w=(w*Wn)%mod)
{
int X=A[j+k],Y=w*A[j+mid+k]%mod;
A[j+k]=(X+Y)%mod;
A[j+mid+k]=(X-Y+mod)%mod;
}
}
}
}
void Soviet()
{
lim=1ll;int l=0;
while(lim<=n+m) lim<<=1ll,++l;
F(i,0,lim) r[i]=(r[i>>1ll]>>1ll)|((i&1ll)<<(l-1));
NTT(a,1);NTT(b,1);
F(i,0,lim) a[i]=(a[i]*b[i])%mod;
NTT(a,-1);
int iv=qpow(lim,-1,mod);
F(i,0,n+m) printf("%lld ",a[i]*iv%mod); //*iv相当于除以一个lim
putchar('\n');
}
#define Flan void
Flan IsMyWife()
{
Input();
Soviet();
}
#undef int //long long
}
int main(){
Flandre_Scarlet::IsMyWife();
getchar();getchar();
return 0;
}
NTT的好处和坏处
好处: 和FFT相比,把浮点数换成整数。常数很小,而且避免了精度问题
坏处: 不需要取模的时候,模数需要足够大 —— 这会导致一些阴间问题
坏处2:模数没有原根的时候非常不好办
FFT,NTT 笔记的更多相关文章
- 再探快速傅里叶变换(FFT)学习笔记(其三)(循环卷积的Bluestein算法+分治FFT+FFT的优化+任意模数NTT)
再探快速傅里叶变换(FFT)学习笔记(其三)(循环卷积的Bluestein算法+分治FFT+FFT的优化+任意模数NTT) 目录 再探快速傅里叶变换(FFT)学习笔记(其三)(循环卷积的Blueste ...
- 快速傅里叶变换(FFT)学习笔记(其二)(NTT)
再探快速傅里叶变换(FFT)学习笔记(其二)(NTT) 目录 再探快速傅里叶变换(FFT)学习笔记(其二)(NTT) 写在前面 一些约定 前置知识 同余类和剩余系 欧拉定理 阶 原根 求原根 NTT ...
- FFT/NTT复习笔记&多项式&生成函数学习笔记Ⅲ
第三波,走起~~ FFT/NTT复习笔记&多项式&生成函数学习笔记Ⅰ FFT/NTT复习笔记&多项式&生成函数学习笔记Ⅱ 单位根反演 今天打多校时 1002 被卡科技了 ...
- [学习笔记&教程] 信号, 集合, 多项式, 以及各种卷积性变换 (FFT,NTT,FWT,FMT)
目录 信号, 集合, 多项式, 以及卷积性变换 卷积 卷积性变换 傅里叶变换与信号 引入: 信号分析 变换的基础: 复数 傅里叶变换 离散傅里叶变换 FFT 与多项式 \(n\) 次单位复根 消去引理 ...
- FFT/NTT/MTT学习笔记
FFT/NTT/MTT Tags:数学 作业部落 评论地址 前言 这是网上的优秀博客 并不建议初学者看我的博客,因为我也不是很了解FFT的具体原理 一.概述 两个多项式相乘,不用\(N^2\),通过\ ...
- FFT/NTT复习笔记&多项式&生成函数学习笔记Ⅰ
众所周知,tzc 在 2019 年(12 月 31 日)就第一次开始接触多项式相关算法,可到 2021 年(1 月 1 日)才开始写这篇 blog. 感觉自己开了个大坑( 多项式 多项式乘法 好吧这个 ...
- 快速构造FFT/NTT
@(学习笔记)[FFT, NTT] 问题概述 给出两个次数为\(n\)的多项式\(A\)和\(B\), 要求在\(O(n \log n)\)内求出它们的卷积, 即对于结果\(C\)的每一项, 都有\[ ...
- FFT/NTT模板 既 HDU1402 A * B Problem Plus
@(学习笔记)[FFT, NTT] Problem Description Calculate A * B. Input Each line will contain two integers A a ...
- 快速傅里叶变换(FFT)学习笔记
定义 多项式 系数表示法 设\(A(x)\)表示一个\(n-1\)次多项式,则所有项的系数组成的\(n\)维向量\((a_0,a_1,a_2,\dots,a_{n-1})\)唯一确定了这个多项式. 即 ...
随机推荐
- spring的ioc容器生成的对象也是代理对象对吗
一直以为spring的ioc容器生成的对象都是代理对象,其实这个是错误的.spring ioc默认的都是原生对象 只有通过aop增强的对象才是代理对象 有@Transactional 注解或者配置 ...
- [leetcode33Search in Rotated Sorted Array]在排序旋转后序列中找目标值
直接上代码 /** * Created by lvhao on 2017/6/30. * Suppose an array sorted in ascending order is rotated a ...
- [leetcode]450. Delete Node in a BST二叉搜索树删除节点
二叉树变量只是一个地址 public static void main(String[] args) { TreeNode t = new TreeNode(3); help(t); System.o ...
- Java IO流 FileOutputStream、FileInputStream的用法
FileOutputStream.FileInputStream的使用 FileOutputStream是OutputStream的继承类,它的主要功能就是向磁盘上写文件.FileOutputStre ...
- 【wp】2020XCTF_逆向
前几天的XCTF最后一场终于打完了,三场比赛下来对逆向部分的大概感觉是从第一场的啥都不会做(一道lua+一道apk)到后来的终于能有参与度,至少后两场的题目都是pc逆向,虽然特殊架构但好歹能做(tcl ...
- hadoop fs -stat 查看文件状态
转载来自:https://blog.csdn.net/knowledgeaaa/article/details/24394287 当向HDFS上写文件时,可以通过设置dfs.block.size配置项 ...
- 2018年第九届蓝桥杯B组(201806-----递增三元组)
给定三个整数数组 A = [A1, A2, - AN], B = [B1, B2, - BN], C = [C1, C2, - CN], 请你统计有多少个三元组(i, j, k) 满足: 1 < ...
- 如何使用蓝湖设计稿同时适配PC及移动端
如何使用蓝湖设计稿同时适配PC及移动端 项目需求: 一套代码同时适配PC及移动端 方案: pc端采用px布局,移动端采用rem布局,通过媒体查询(media query)切换 坑: 尝试过使用post ...
- fastjson反序列化漏洞原理及利用
重要漏洞利用poc及版本 我是从github上的参考中直接copy的exp,这个类就是要注入的类 import java.lang.Runtime; import java.lang.Process; ...
- python virtualenv 基本使用
下载 pip install virtualenv 校验是否成功 virtualenv --version 使用 创建env环境 要写一个新项目,使用env先创建环境 cd xx\xx\xx\ # 进 ...