FFT,NTT 笔记

FFT

简介

FFT是干啥的？它是用来加速多项式乘法的。我们平时经常求多项式乘法，比如\((x+1)(x+3)=(x^2+4x+3)\)。假设两个式子都是\(n\)项（不足的补0），那朴素的算法是\(O(n^2)\)的。

那么，我们能做到\(O(nlogn)\)做么？

前置知识

多项式点值表示

我们平常表达多项式，都是用系数表达的。当然，还有点值表达。用平面直角坐标系上的\(n\)个点，唯一确定一个（不超过）\(n-1\)次的多项式。它的一个特殊形式，就是两点确定一条直线。

点值转系数表达，你只需要解一个方程组就珂以了。（高斯消元，这样是\(O(n^3)\)的）

复数

复数的定义

这个很多人知道。定义\(i=\sqrt{-1}\)，即虚数单位。形如\(a+bi\)的数就是复数（complex）。

复数\(a+bi\)的辐角：从\((0,0)\)到\((a,b)\)的线段和\(x\)轴的夹角。这个夹角，是顺时针方向的夹角。取值范围是\([0,360]\)。

复数的几何意义

在一维数轴上，我们把一个数乘以\(-1\)，相当于旋转了\(180\)。

那么，我们把一个数乘以\(\sqrt{-1}\)，相当于：乘两次是旋转\(180\)。所以，乘一次就是旋转\(90\)，也就是竖起来了。“竖起来”，这个概念很好表示，就是\(y\)坐标。

那么，\(a+bi\)就相当于平面直角坐标系上的点\((a,b)\)。当然，你也珂以把它看成一个向量，从\((0,0)\)到\((a,b)\)。

复数的运算

复数的加法：\((a_1+b_1i)+(a_2+b_2i)=(a_1+a_2)+(b_1+b_2)i\)。（这样也就包含了减法的情况）

复数的乘法：\((a_1+b_1i)\times (a_2+b_2i)\)

我们把括号拆开，然后把\(i^2\)都变成\(-1\)（由\(i\)的定义）。易得，它等于：\((a_1a_2-b_1b_2)+(a_1b_2+a_2b_1)i\)

（n次）单位复根

满足\(x^n=1\)的所有复数解中，辐角最小且不为\(0\)的那个复数。记作\(w_n\)。不难发现，所有满足条件的\(x\)，用向量表示后，把单位圆\(n\)等分。

举个栗子，\(n=6\)的时候，解的分布是这样的：

其中，\(\omega_n\)就是图中标出来的，辐角大于0且最小的那个向量。

单位复根的性质

\(w_{2n}^{2k}=w_{n}^{k}\)（珂以把\(w_n^k\)看成是\(360\deg\times \dfrac{k}{n}\)，这条证毕）
\(w_n^{k+n/2}=-w_n^k\)。（这里\(n/2\)不取整，就是小数）（把\(n/2\)看成是转半圈，转半圈也就是\(x,y\)坐标都变负，这条也证毕）

正式开始！

上面不是说了点值表示么。对于两个用点值表示的多项式，只要把对应的点值乘起来即珂。

但是，我们要取\(n\)个点（DFT），每次\(O(n)\)求值，不是要\(O(n^2)\)了么？

而且，把点值转换成系数（插值，IDFT）的过程，不是要\(O(n^3)\)么？

因此，我们的主干思想是：利用单位复根的性质，巧妙的求值/插值，使得我们在\(O(nlogn)\)的时间内完成这些操作。

简图（远航之曲大佬的图）：

DFT

就是快速带入点值的过程。

我们的多项式：\(A(x)=a_0x^0+a_1x^1+a_2x^2...+a_{n-1}x^{n-1}\)。其中\(a_0,a_1...a_n\)是系数（题目给定）。

接下来，我们设\(n=2^k\)。不足的地方用\(0\)补齐。

把它的系数按下表奇偶分组（指数还是顺序下来的）：

\(A_0(x)=a_0x^0+a_2x^1+a_4x^2...+a_{n-2}x^{n/2-1}\)

\(A_1(x)=a_1x^0+a_3x^1+a_5x^2...+a_{n-1}x^{n/2-1}\)

易得\(A(x)=A_0(x^2)+xA_1(x^2)\)。

那么，我们代入\(x=w_n^0,w_n,w_n^2...w_{n}^{n-1}\)。

考虑求前面\(n/2\)个，然后直接得到后面\(n/2\)个。令\(k\in [0,n/2)\)，则：

\(A(w_n^k)=A_0(w_n^{2k})+w_n^kA_1(w_n^{2k})\)

然后我们再代入\(w_n^{k+n/2}=-w_n^k\)：

\(A(w_n^{k+n/2})=A_0(w_n^2k)-A_1(w_n^2k)\)

我们发现，\(w_n^{k+n/2}=-w_n^k\)。然而\(A_0,A_1\)里面是\(x^2\)，所以取负不影响\(A_0\)和\(A_1\)的结果，只有\(A_1\)前面那一项有一个正负号的区别！

所以，我们求出前一半，就珂以\(O(n)\)求出后一半。

这样显然是\(O(nlogn)\)的。

DFT的实现优化

刚刚做完\(O(nlogn)\)的式子。但是，实现的时候，递归似乎太慢了，还不如暴力来的快。

我们观察一下，被奇偶分组后的下标。

（草图）

转换一下二进制：

000 001 010 011 100 101 110 111

变成：

000 100 010 110 001 101 011 111

相当于每个二进制数位反过来了。

然后我们通过递推，推出最后的状态。然后不断合并，合并成答案。成功的把递归转化掉了。这样还是\(O(nlogn)\)，但是快了很多！

IDFT

IDFT，就是我们已知一个点值表示的多项式，而且代入的点值还是\(w_n^0,w_n^1...w_n^{n-1}\)。

我们设出系数\(a_0,a_1..a_{n-1}\)，列出方程：

\[\begin{cases}
a_0(w_n^0)^0+a_1(w_n^0)^1...+a_{n-1}(w_n^0)^{n-1}=A(w_n^0)\\
a_0(w_n^1)^0+a_1(w_n^1)^1...+a_{n-1}(w_n^1)^{n-1}=A(w_n^1)\\
...\\
a_0(w_n^{n-1})^0+a_1(w_n^{n-1})^1...+a_{n-1}(w_n^{n-1})^{n-1}=A(w_n^{n-1})\\
\end{cases}
\]

用矩阵表达：

\[\begin{bmatrix}
(w_n^0)^0 & (w_n^0)^1 & ... & (w_n^0)^{n-1}\\
(w_n^1)^0 & (w_n^1)^1 & ... & (w_n^1)^{n-1}\\
...\\
(w_n^{n-1})^0 & (w_n^{n-1})^1 & ... & (w_n^{n-1})^{n-1}
\end{bmatrix}
\times
\begin{bmatrix}
a_0\\
a_1\\
.\\
.\\
.\\
a_{n-1}
\end{bmatrix}=
\begin{bmatrix}
A(w_n^0)\\
A(w_n^1)\\
.\\
.\\
.\\
A(w_n^{n-1})
\end{bmatrix}
\]

设这个式子是“珂朵莉IDFT①式”

然后设矩阵\(D\)，\(D\)中的每一项和左边那个矩阵

\[V=\begin{bmatrix}
(w_n^0)^0 & (w_n^0)^1 & ... & (w_n^0)^{n-1}\\
(w_n^1)^0 & (w_n^1)^1 & ... & (w_n^1)^{n-1}\\
...\\
(w_n^{n-1})^0 & (w_n^{n-1})^1 & ... & (w_n^{n-1})^{n-1}
\end{bmatrix}
\]

中对应位置上的项，都是倒数。

易证，\(D\times V=n\times I_n\)，其中\(I_n\)是\(n\)阶单位矩阵。

那也就是，\(D=\dfrac{1}{n}V^{-1}\)

把“珂朵莉IDFT①式”中，左右两边同时乘一个\(D=\dfrac{1}{n}V^{-1}\)。

易得：

\[\begin{bmatrix}
a_0\\
a_1\\
.\\
.\\
.\\
a_{n-1}
\end{bmatrix}=
\dfrac{1}{n}D
\begin{bmatrix}
A(w_n^0)\\
A(w_n^1)\\
.\\
.\\
.\\
A(w_n^{n-1})
\end{bmatrix}
\]

那么我们把矩阵\(V\)中，所有项取倒数，然后做一遍\(DFT\)即珂。最后记得除一个\(n\)。

模板题的代码

洛谷 3803



#include <bits/stdc++.h>

using namespace std;

namespace Flandre_Scarlet

{

    #define N 3000006 //空间的理论下限

    //2097153=2^21+1

    #define real double

    #define Pi (3.14159265358979323846264338)

    #define F(i,l,r) for(int i=l;i<=r;++i)

    #define D(i,r,l) for(int i=r;i>=l;--i)

    #define Fs(i,l,r,c) for(int i=l;i<=r;c)

    #define Ds(i,r,l,c) for(int i=r;i>=l;c)

    #define MEM(x,a) memset(x,a,sizeof(x))

    #define FK(x) MEM(x,0)

    #define Tra(i,u) for(int i=G.Start(u),__v=G.To(i);~i;i=G.Next(i),__v=G.To(i))

    #define p_b push_back

    #define sz(a) ((int)a.size())

    #define iter(a,p) (a.begin()+p)

    void R1(int &x)

    {

        x=0;char c=getchar();int f=1;

        while(c<'0' or c>'9') f=(c=='-')?-1:1,c=getchar();

        while(c>='0' and c<='9') x=(x<<1)+(x<<3)+(c^48),c=getchar();

        x=(f==1)?x:-x;

    }

    void Rd(int cnt,...)

    {

        va_list args;

        va_start(args,cnt);

        F(i,1,cnt)

        {

            int* x=va_arg(args,int*);R1(*x);

        }

        va_end(args);

    }

    struct cp{real R,I;}; //复数类

    //R: 实部，a+bi中的a

    //I：虚部，a+bi中的b

    cp operator+(cp a,cp b){return (cp){a.R+b.R,a.I+b.I};}

    cp operator-(cp a,cp b){return (cp){a.R-b.R,a.I-b.I};}

    cp operator*(cp a,cp b){return (cp){a.R*b.R-a.I*b.I,a.R*b.I+a.I*b.R};}

    int n,m;

    cp a[N],b[N];

    void Input()

    {

        Rd(2,&n,&m);

        F(i,0,n) {int x;R1(x);a[i].R=x;}

        F(i,0,m) {int x;R1(x);b[i].R=x;}

    }

    int r[N],lim;

    void FFT(cp A[],int type)

    //type=1: DFT

    //type=-1: IDFT

    {

        F(i,0,lim) if (i<r[i]) swap(A[i],A[r[i]]);

        for(int mid=1;mid<lim;mid<<=1) //合并区间的长度

        //每次合并两个长度为mid的区间

        {

            cp Wn=(cp){cos(Pi/mid),type*sin(Pi/mid)};

            // 单位圆上的坐标 (x,y) 满足 x^2+y^2=1

            // 那么 x+yi 的逆就是 x-yi

            // 很容易验证：(x+yi)(x-yi)=x^2-(yi)^2=x^2+y^2=1

            for(int j=0;j<lim;j+=(mid<<1))

            {

                cp w=(cp){1,0}; //Wn^0

                for(int k=0;k<mid;++k,w=w*Wn) //w:不断代入Wn^k

                {

                    cp X=A[j+k],Y=w*A[j+mid+k];

                    //DFT的合并式子

                    A[j+k]=X+Y;

                    A[j+mid+k]=X-Y;

                }

            }

        }

    }

    void Soviet()

    {

        int l=0;lim=1;

        while(lim<=n+m) lim<<=1,++l;

        F(i,0,lim) r[i]=(r[i>>1]>>1)|((i&1)<<(l-1));

        FFT(a,1);FFT(b,1); //两个DFT

        F(i,0,lim) a[i]=a[i]*b[i]; //点值乘法

        FFT(a,-1); //IDFT

        F(i,0,n+m) printf("%d ",(int)(a[i].R/lim+0.5)); //还要乘一个1/lim

        //+0.5是取四舍五入

        putchar('\n');

    }

    #define Flan void

    Flan IsMyWife()

    {

        Input();

        Soviet();

    }

}

int main(){

    Flandre_Scarlet::IsMyWife();

    getchar();getchar();

    return 0;

}

NTT

NTT本质上就是把\(FFT\)中的单位复根换成一个有相同性质的整数：原根。

只要记住\(998244353\)的原根是\(3\)即珂。

然后和\(FFT\)同样的方法去写就珂以了，也是DFT+IDFT。

就是把里面单位复根换成原根，一样写即可。

代码：



#include <bits/stdc++.h>using namespace std;

namespace Flandre_Scarlet

{

    #define N 2666666

    #define mod 998244353

    #define Gi  332748118 //3^(-1) mod 998244353

    #define int long long

    #define F(i,l,r) for(int i=l;i<=r;++i)

    #define D(i,r,l) for(int i=r;i>=l;--i)

    #define Fs(i,l,r,c) for(int i=l;i<=r;c)

    #define Ds(i,r,l,c) for(int i=r;i>=l;c)

    #define MEM(x,a) memset(x,a,sizeof(x))

    #define FK(x) MEM(x,0)

    #define Tra(i,u) for(int i=G.Start(u),__v=G.To(i);~i;i=G.Next(i),__v=G.To(i))

    #define p_b push_back

    #define sz(a) ((int)a.size())

    #define iter(a,p) (a.begin()+p)

    void R1(int &x)

    {

        x=0;char c=getchar();int f=1;

        while(c<'0' or c>'9') f=(c=='-')?-1:1,c=getchar();

        while(c>='0' and c<='9') x=(x<<1)+(x<<3)+(c^48),c=getchar();

        x=(f==1)?x:-x;

    }

    void Rd(int cnt,...)

    {

        va_list args;

        va_start(args,cnt);

        F(i,1,cnt)

        {

            int* x=va_arg(args,int*);R1(*x);

        }

        va_end(args);

    }

    int n,m;

    int a[N],b[N];

    void Input()

    {

        Rd(2,&n,&m);

        F(i,0,n) R1(a[i]);

        F(i,0,m) R1(b[i]);

    }

    int qpow_p(int a,int b,int m) //正数的快速幂

    {

        int r=1;

        while(b)

        {

            if (b&1) r=r*a%m;

            a=a*a%m,b>>=1;

        }

        return r;

    }

    int qpow(int a,int b,int m) //支持负指数的快速幂（就是先求快速幂，然后求一个逆元）

    {

        if (b==0) return 1;

        else if (b<0) return qpow_p(qpow_p(a,-b,m),m-2,m);

        else return qpow_p(a,b,m);

    }

    int r[N],lim;

    void NTT(int A[N],int type)

    {

        F(i,0,lim) if (i<r[i]) swap(A[i],A[r[i]]);

        for(int mid=1;mid<lim;mid<<=1)

        {

            int Wn=qpow(qpow(3,type,mod),(mod-1)/(mid<<1),mod);

            for(int j=0;j<lim;j+=(mid<<1))

            {

                int w=1;

                for(int k=0;k<mid;k++,w=(w*Wn)%mod)

                {

                    int X=A[j+k],Y=w*A[j+mid+k]%mod;

                    A[j+k]=(X+Y)%mod;

                    A[j+mid+k]=(X-Y+mod)%mod;

                }

            }

        }

    }

    void Soviet()

    {

        lim=1ll;int l=0;

        while(lim<=n+m) lim<<=1ll,++l;

        F(i,0,lim) r[i]=(r[i>>1ll]>>1ll)|((i&1ll)<<(l-1));

        NTT(a,1);NTT(b,1);

        F(i,0,lim) a[i]=(a[i]*b[i])%mod;

        NTT(a,-1);

        int iv=qpow(lim,-1,mod);

        F(i,0,n+m) printf("%lld ",a[i]*iv%mod); //*iv相当于除以一个lim

        putchar('\n');

    }

    #define Flan void

    Flan IsMyWife()

    {

        Input();

        Soviet();

    }

    #undef int //long long

}

int main(){

    Flandre_Scarlet::IsMyWife();

    getchar();getchar();

    return 0;

}

NTT的好处和坏处

好处：和FFT相比，把浮点数换成整数。常数很小，而且避免了精度问题

坏处：不需要取模的时候，模数需要足够大 —— 这会导致一些阴间问题

坏处2：模数没有原根的时候非常不好办

FFT,NTT 笔记的更多相关文章

再探快速傅里叶变换(FFT)学习笔记(其三)(循环卷积的Bluestein算法+分治FFT+FFT的优化+任意模数NTT)
再探快速傅里叶变换(FFT)学习笔记(其三)(循环卷积的Bluestein算法+分治FFT+FFT的优化+任意模数NTT) 目录再探快速傅里叶变换(FFT)学习笔记(其三)(循环卷积的Blueste ...
快速傅里叶变换(FFT)学习笔记(其二)(NTT)
再探快速傅里叶变换(FFT)学习笔记(其二)(NTT) 目录再探快速傅里叶变换(FFT)学习笔记(其二)(NTT) 写在前面一些约定前置知识同余类和剩余系欧拉定理阶原根求原根 NTT ...
FFT/NTT复习笔记&多项式&生成函数学习笔记Ⅲ
第三波,走起~~ FFT/NTT复习笔记&多项式&生成函数学习笔记Ⅰ FFT/NTT复习笔记&多项式&生成函数学习笔记Ⅱ 单位根反演今天打多校时 1002 被卡科技了 ...
[学习笔记&教程] 信号, 集合, 多项式, 以及各种卷积性变换 (FFT,NTT,FWT,FMT)
目录信号, 集合, 多项式, 以及卷积性变换卷积卷积性变换傅里叶变换与信号引入: 信号分析变换的基础: 复数傅里叶变换离散傅里叶变换 FFT 与多项式 \(n\) 次单位复根消去引理 ...
FFT/NTT/MTT学习笔记
FFT/NTT/MTT Tags:数学作业部落评论地址前言这是网上的优秀博客并不建议初学者看我的博客,因为我也不是很了解FFT的具体原理一.概述两个多项式相乘,不用\(N^2\),通过\ ...
FFT/NTT复习笔记&多项式&生成函数学习笔记Ⅰ
众所周知,tzc 在 2019 年(12 月 31 日)就第一次开始接触多项式相关算法,可到 2021 年(1 月 1 日)才开始写这篇 blog. 感觉自己开了个大坑( 多项式多项式乘法好吧这个 ...
快速构造FFT/NTT
@(学习笔记)[FFT, NTT] 问题概述给出两个次数为\(n\)的多项式\(A\)和\(B\), 要求在\(O(n \log n)\)内求出它们的卷积, 即对于结果\(C\)的每一项, 都有\[ ...
FFT/NTT模板既 HDU1402 A * B Problem Plus
@(学习笔记)[FFT, NTT] Problem Description Calculate A * B. Input Each line will contain two integers A a ...
快速傅里叶变换(FFT)学习笔记
定义多项式系数表示法设\(A(x)\)表示一个\(n-1\)次多项式,则所有项的系数组成的\(n\)维向量\((a_0,a_1,a_2,\dots,a_{n-1})\)唯一确定了这个多项式. 即 ...

随机推荐

git pull 和git fetch的区别
git pull 是上下文环境敏感的,它会把所有的提交自动给你合并到当前分支当中,没有复查的过程而git fetch只是把拉去的提交存储到本地仓库中,真正合并到主分支中需要使用merage head ...
JavaDailyReports10_04
修改后的出题系统 1.添加用户自定义是否出现乘除法,自由选择符号和个数,并且可以自定义操作数的取值范围. 1 /* 2 * 2.可定制(数量/打印方式):输入大的数量值,测试一下系统是否崩溃,反向查找 ...
解决npm ERR!
一:[Unexpected end of JSON input while parsing near]报错最近的vue项目中在执行 npm install 时会报错误: npm ERR! Unexp ...
web攻防环境--一句话木马
任务一.基于centos7搭建dvwa web服务靶机 1.在centos7安装LAMP并启动,访问phpinfo页面也即安装httpd.php.mysql服务. 直接进行yum安装即可,完成后检查 ...
错误总结Mapper扫描不到
Unsatisfied dependency expressed through field 'baseMapper'; nested exception is org.springframework ...
EF Core CodeFirst数据库自动迁移
开发过程中都会遇到数据库数据结构更新的问题,怎么对数据库更新进行版本控制呢? 不同的项目对数据库版本更新控制的方式不同,常用的有第三方Evolve,开发人员将数据库更新脚本按照版本号的放在一起,然后执 ...
UnRAID_6.8.2_配置_设置
UnRAID_6.8.2_配置_设置转载注明来源: 本文链接来自osnosn的博客,写于 2020-10-05. 参考: UnRAID download Getting_Started Offic ...
“==”和equals的区别
区别: (1)比较基本数据类型时只能采用"==",比较的是数值; (2)当比较引用数据类型时 "==" 比较的是引用对象的内存地址; 而equals分两种情况 ...
如何将未呈现的WPF控件保存到图片
SaveFileDialog save = new SaveFileDialog(); save.Filter = "BMP|*.bmp|PNG|*.png|JPG|*.jpg"; ...
废弃fastjson！大型项目迁移Gson保姆级攻略
前言大家好,又双叒叕见面了,我是天天放大家鸽子的蛮三刀. 在被大家取关之前,我立下一个"远大的理想",一定要在这周更新文章.现在看来,flag有用了... 本篇文章是我这一个多月 ...