【算法】快速数论变换(NTT)初探

【简介】

　　快速傅里叶变换(FFT)运用了单位复根的性质减少了运算，但是每个复数系数的实部和虚部是一个余弦和正弦函数，因此系数都是浮点数，而浮点数的运算速度较慢且可能产生误差等精度问题，因此提出了以数论为基础的具有循环卷积性质的快速数论变换(NTT)。

　　在FFT中，通过$n$次单位复根即$\omega^n=1$的$\omega$来运算，而对于NTT来说，则是运用了素数的原根来运算。

【原根】

【定义】

　　对于两个正整数$a,m$满足$gcd(a, m)=1$，由欧拉定理可知，存在正整数$d\leq m-1$，如$d=\varphi(m)$，使得$a^d\equiv 1(mod\ m)$。

　　因此，在$gcd(a, m)=1$时，定义$a$对模$m$的指数$\delta m(a)$为使$a^d\equiv 1(mod\ m)$成立的最小正整数$d$。若$\delta m(a)=\varphi (m)$，则称$a$是模$m$的原根。

【性质/定义2】

　　若一个数$g$是对于$P$的原根，那么$g^i\ mod\ P,1\leq i<P$的结果互不相同。

【求原根方法】

　　对质数$P-1$分解质因数得到不同的质因子$p_1,p_2,p_3,...,p_n$，对于任何$2\leq a\leq P-1$，判定$a$是否为$P$的原根，只需要检验$a^{\frac{P-1}{p_1}},a^{\frac{P-1}{p_2}},...,a^{\frac{P-1}{p_n}}$这n个数中，是否存在一个数$mod\ P$为$1$，若存在，则$a$不是$P$的原根，否则$a$是$P$的原根。

【正确性证明】

　　假设存在一个$t<\varphi(P)=P-1$使得$a^t\equiv 1(mod\ P)$且$\forall i\subseteq [1,P),a^{\frac{P-1}{p_i}}\ mod\ P \neq 1$。

　　由裴蜀定理得，一定存在一组$k,x$使得$kt=(P-1)x+gcd(t, P-1)$

　　由欧拉定理/费马小定理得，$a^{P-1}\equiv 1(mod\ P)$

　　于是$1\equiv a^{kt}\equiv a^{(P-1)x+gcd(t, P-1)}\equiv a^{gcd(t, P-1)}(mod\ P)$

　　$t<P-1$故$gcd(t, P-1)<P-1$

　　又$gcd(t, P-1)|P-1$，于是$gcd(t, P-1)$必整除$a^{\frac{P-1}{p_1}},a^{\frac{P-1}{p_2}},...,a^{\frac{P-1}{p_n}}$中至少一个，设$gcd(t, P-1)|a^{\frac{P-1}{p_i}}$，则$a^{\frac{P-1}{p_i}}\equiv a^{gcd(t, P-1)}\equiv 1(mod\ P)$。

　　故假设不成立。

【用途】

　　我们可以发现原根$g$拥有所有FFT所需的$\omega$的性质，于是如果我们用$g^{\frac{P-1}{N}}(mod\ P)$来代替$\omega_n=e^{\frac{2\pi i}{N}}$，就能把复数对应成一个整数，在$(mod\ P)$意义下做快速变换了。

【NTT模数】

　　显然在上述的用途中，$P$必须是素数且$N$必须是$P-1$的因数，因为$N$是$2$的幂，所以可以构造形如$P=c\cdot 2^k+1$的素数。

　　常见的形如$P=c\cdot 2^k+1$的素数有$998244353=119\cdot 2^{23}+1,1004535809=479\cdot 2^{21}+1$，它们的原根都为$3$

　　如果题目的模数$P$任意怎么办？我们取的模数必须超过$n(P-1)^2$

　　那么我们可以取多个模数（乘积$> n(P-1)^2$）做完NTT之后用CRT合并...

　　模数表：http://blog.miskcoo.com/2014/07/fft-prime-table

【例题】

例1：bzoj2179: FFT快速傅立叶

　　原来的配方，熟悉的味道...（怎么比FFT慢了

#include<iostream>

#include<cstring>

#include<cstdlib>

#include<cstdio>

#include<algorithm>

#define ll long long

#define MOD(x) ((x)>=mod?(x)-mod:(x))

using namespace std;

const int maxn=, inf=1e9, mod=;

int n, N;

int a[maxn], b[maxn], c[maxn];

char s[maxn];

inline int power(int a, int b)

{

    int ans=;

    for(;b;b>>=, a=1ll*a*a%mod)

    if(b&) ans=1ll*ans*a%mod;

    return ans;

}

inline void ntt(int *a, int f)

{

    for(int i=, j=;i<N;i++)

    {

        if(i<j) swap(a[i], a[j]);

        for(int k=N>>;(j^=k)<k;k>>=);

    }

    for(int i=;i<=N;i<<=)

    {

        int nw=power(, (mod-)/i);

        if(f==-) nw=power(nw, mod-);

        for(int j=, m=i>>;j<N;j+=i)

        for(int k=, w=;k<m;k++)

        {

            int t=1ll*a[j+k+m]*w%mod;

            a[j+k+m]=MOD(a[j+k]-t+mod);

            a[j+k]=MOD(a[j+k]+t);

            w=1ll*w*nw%mod;

        }

    }

    if(f==-) for(int i=, inv=power(N, mod-);i<N;i++) a[i]=1ll*a[i]*inv%mod;

}

int main()

{

    scanf("%d", &n); for(N=;N<(n<<);N<<=);

    scanf("%s", s); for(int i=;i<n;i++) a[n-i-]=s[i]-'';

    scanf("%s", s); for(int i=;i<n;i++) b[n-i-]=s[i]-'';

    ntt(a, ); ntt(b, );

    for(int i=;i<N;i++) c[i]=1ll*a[i]*b[i]%mod;

    ntt(c, -);

    for(int i=;i<N;i++)

    if(c[i]>=)

    {

        c[i+]+=c[i]/; c[i]%=;

        if(i==N-) N++;

    }

    N--; while(!c[N] && N>) N--;

    for(int i=N;~i;i--) printf("%d", c[i]);

}

例2：bzoj3992: [SDOI2015]序列统计

　　DP。

　　$f[i][j]$为前$i$个数总和$mod\ m$后为$j$的方案数，$B[i]$为集合内数$mod\ m$后为$i$的数的个数。$$f[i][j*k\%m]=\sum f[i-1][j]*B[k]$$

　　这个式子显然是可以矩阵快速幂优化的，效率$O(m^2logn)$，还是会TLE。

　　对所有数$x$，设$g^i(mod\ m)=x$，则将$x$映射为$i$，即取$x$在模$m$意义下的离散对数，$c$为$f[L]$，$a$为$f[L-1]$。

　　原式改为：$$c[(i+j)\%(\varphi(m)=m-1)]=\sum_{k=0}^{i+j} a[i]\cdot b[i+j-k]$$

　　卷积形式，上NTT

　　注意乘出来超过$m-1$项，而次数超过$m-1$项的贡献应加回次数减去$m-1$的项中，即上方式子的取模操作。

　　NTT次数较多预处理出$g$的所有次幂会快一些，而且因为不明原因直接取模会比快速取模快，CPU你怎么这么难伺候...

#include<iostream>

#include<cstring>

#include<cstdlib>

#include<cstdio>

#define MOD(x) ((x)>=mod?(x)-mod:(x))

#include<algorithm>

#define ll long long

using namespace std;

const int maxn=, inf=1e9, mod=;

int n, m, x, s, N, g, X;

int a[maxn], b[maxn], A[maxn], B[maxn], ind[maxn], p[maxn], g1[maxn], g2[maxn];

inline void read(int &k)

{

    int f=; k=; char c=getchar();

    while(c<'' || c>'') c=='-'&&(f=-), c=getchar();

    while(c<='' && c>='') k=k*+c-'', c=getchar();

    k*=f;

}

inline int power(int a, int b, int p)

{

    int ans=;

    for(;b;b>>=, a=1ll*a*a%p)

    if(b&) ans=1ll*ans*a%p;

    return ans;

}

inline bool judge(int x)

{

    for(int i=;i<=p[];i++)

    if(power(x, (m-)/p[i], m)==) return ;

    return ;

}

inline int yg(int x)

{

    x--;

    for(int i=;i*i<=x;i++)

    if(x%i==)

    {

        p[++p[]]=i;

        while(x%i==) x/=i;

    }

    if(x>) p[++p[]]=x;

    for(int i=;;i++) if(judge(i)) return i;

}

inline void init()

{

    int base1=power(, (mod-)/N, mod), base2=power(base1, mod-, mod);

    g1[]=g2[]=;

    for(int i=;i<=N;i++) g1[i]=1ll*g1[i-]*base1%mod, g2[i]=1ll*g2[i-]*base2%mod;

}

inline void ntt(int *a, int *w, int f)

{

    for(int i=, j=;i<N;i++)

    {

        if(i<j) swap(a[i], a[j]);

        for(int k=N>>;(j^=k)<k;k>>=);

    }

    for(int i=;i<=N;i<<=)

    for(int j=, m=i>>;j<N;j+=i)

    for(int k=;k<m;k++)

    {

        int t=1ll*a[j+k+m]*w[N/i*k]%mod;

        a[j+k+m]=(a[j+k]-t+mod)%mod;

        a[j+k]=(a[j+k]+t)%mod;

    }

    if(f==-) for(int i=, inv=power(N, mod-, mod);i<N;i++) a[i]=1ll*a[i]*inv%mod;

}

inline void mul(int *a, int *b, int *c)

{

    memcpy(A, a, N<<); memcpy(B, b, N<<);

    ntt(A, g1, ); ntt(B, g1, );

    for(int i=;i<N;i++) c[i]=1ll*A[i]*B[i]%mod;

    ntt(c, g2, -);

    for(int i=;i<m-;i++) c[i]=MOD(c[i]+c[i+m-]), c[i+m-]=;

}

int main()

{

    read(n); read(m); read(X); read(s); g=yg(m);

    for(int i=, j=;i<m-;i++, j=1ll*j*g%m) ind[j]=i; X=ind[X];

    for(N=;N<m;N<<=); N<<=; init();

    for(int i=;i<=s;i++) read(x), x && (a[ind[x]]++); b[]=;

    for(;n;n>>=, mul(a, a, a)) if(n&) mul(a, b, b);

    printf("%d\n", b[X]);

}

例3：

【算法】快速数论变换(NTT)初探的更多相关文章

Algorithm: 多项式乘法 Polynomial Multiplication: 快速傅里叶变换 FFT / 快速数论变换 NTT
Intro: 本篇博客将会从朴素乘法讲起,经过分治乘法,到达FFT和NTT 旨在能够让读者(也让自己)充分理解其思想模板题入口:洛谷 P3803 [模板]多项式乘法(FFT) 朴素乘法约定:两个多 ...
JZYZOJ 2041 快速数论变换 NTT 多项式
http://172.20.6.3/Problem_Show.asp?id=2041 https://blog.csdn.net/ggn_2015/article/details/68922404 代 ...
[快速数论变换 NTT]
先粘一个模板.这是求高精度乘法的 #include <bits/stdc++.h> #define maxn 1010 using namespace std; char s[maxn]; ...
快速数论变换(NTT)小结
NTT 在FFT中,我们需要用到复数,复数虽然很神奇,但是它也有自己的局限性--需要用double类型计算,精度太低那有没有什么东西能够代替复数且解决精度问题呢? 这个东西,叫原根原根阶若\( ...
模板 - 数学 - 多项式 - 快速数论变换/NTT
Huffman分治的NTT,常数一般.使用的时候把多项式的系数们放进vector里面,然后调用solve就可以得到它们的乘积.注意这里默认最大长度是1e6,可能需要改变. #include<bi ...
快速数论变换NTT模板
51nod 1348 乘积之和 #include <cmath> #include <iostream> #include <cstdio> #include &l ...
从傅里叶变换(FFT)到数论变换(NTT)
FFT可以用来计算多项式乘法,但是复数的运算中含有大量的浮点数,精度较低.对于只有整数参与运算的多项式,有时,$\text{NTT(Number-Theoretic Transform)}$会是更 ...
「算法笔记」快速数论变换（NTT）
一.简介前置知识:多项式乘法与 FFT. FFT 涉及大量 double 类型数据操作和 $\sin,\cos$ 运算,会产生误差.快速数论变换(Number Theoretic Transfo ...
多项式之快速傅里叶变换(FFT)/数论变换(NTT)/常用套路【入门】
原文链接https://www.cnblogs.com/zhouzhendong/p/Fast-Fourier-Transform.html 多项式之快速傅里叶变换(FFT)/数论变换(NTT)/ ...

随机推荐

BUUCTF--reverse3
测试文件:https://buuoj.cn/files/aa4f6c7e8d5171d520b95420ee570e79/a9d22a0e-928d-4bb4-8525-e38c9481469e.ra ...
攻防世界--Hello, CTF
测试文件地址:https://www.lanzous.com/i5ot1yd 使用IDA1打开打开之后,这个字符串和第一题的有些类似,拿去转换一下,Flag就得到了 CrackMeJustForFu ...
【JAVA】 03-Java中的异常和包的使用
链接: 笔记目录:毕向东Java基础视频教程-笔记 GitHub库:JavaBXD33 目录: <> <> 内容待整理: 异常异常和错误的发生和区别异常:java运行期间发 ...
ES6——函数-参数
函数的参数: 1.参数扩展/数组展开 1)收集(剩余的)参数 function show(a,b,...args){} // 三点运算符 *Rest ...
312-金胜维 P系列2.5寸 480G SATA3 SSD固态硬盘
金胜维 P系列2.5寸 480G SATA3 SSD固态硬盘一.概述 P系列为KingSpec金胜维针对入门级消费群体推出的一款高性价SSD固态硬盘,采用7mm超薄金属冲压外壳,板载优质TL ...
BZOJ 2141 排队（CDQ分治）
[BZOJ2141]排队这道题和动态逆序对比较像(BZOJ-3295 没做过的同学建议先做这题),只是删除操作变成了交换.解法:交换操作可以变成删除加插入操作,那么这题就变成了 (时间,位置,值)的 ...
Vue--按键修饰符（逐个学习按键修饰符）
在监听键盘事件时,我们经常需要检查常见的键值.Vue 允许为 v-on 在监听键盘事件时添加按键修饰符: <!-- 只有在 `keyCode` 是 13 时调用 `vm.submit()` -- ...
Django前后端分离跨域请求问题
一.问题背景之前使用django+vue进行前后端分离碰到跨域请求问题,跨域(域名或者端口不同)请求问题的本质是由于浏览器的同源策略导致的,当请求的响应不是处于同一个域名和端口下,浏览器不会接受响应 ...
centos6.8安装tomcat多容器的处理办法，及安装zk、dubbo
系统环境: Linux-centosOS6.8-bit64 JDK1.8 1.Tomcat多容器的处理方案首先,不论tomcat的版本是否有多个,路径是否相同,肯定的是可以运行多个容器. 处理以下两 ...
Juint test Case 的2种使用方式
通常情况下,我们去测试一个类中的方法,首先是建立一个包,包中建立一个测试类,在建立测试类文件时,选择JUnit Test Case,如下: 建好之后写测试用例: 但是如果偏就想在编写方法的那个java ...

【算法】快速数论变换(NTT)初探

【算法】快速数论变换(NTT)初探的更多相关文章

随机推荐

热门专题