FFT 小记
写在前面
\(Q:\) 为什么会心血来潮去学 FFT
\(A:\) 当本蒟蒻还在努力消化凸包时:。所以本蒟蒻也来看一下
等等 摸头警告 。思维已经废了
About FFT
FFT( \(Fast\ Fourier\ Transformation\) )
中文名:快速傅里叶变换
Fast Fast TLE
作用:在 \(O(n\log n)\) 内求出多项式卷积
多项式
一个形如 \(A(x)=a_0+a_1x+\cdot\cdot\cdot+a_{n-2}x^{n-2}+a_{n-1}x^{n-1}=\sum_{i=0}^{n-1}a_ix^i\) 的柿子,称其为多项式
系数表示法
将 \(n-1\) 次多项式看成一个 \(n\) 维向量 \(\vec a=(a_0,a_1,\cdot\cdot\cdot,a_{n-1})\) 即为多项式的系数表示
点值表示法
\(n-1\) 次多项式 \(A(x)\) 将 \(n\) 个不同的 x 代入可得到 n 个点,能唯一确定多项式 \(A(x)\)
多项式乘法
\(A(x)=\sum_{i=0}^{n-1}a_ix^i,B(x)=\sum_{i=0}^{n-1}b_ix^i\) 则 \(C(x)=A(x)*B(x)=\sum_{i=0}^{2n-2}\sum_{j+k=i}a_jb_kx_i\)
卷积
两个向量 \(\vec a=(a_0,a_1,\cdot\cdot\cdot,a_{n-1}),\vec b=(b_0,b_1,\cdot\cdot\cdot,b_{n-1})\)
有卷积 \(\vec a \otimes \vec b=c(c_0,c_1,\cdot\cdot\cdot,c_{2n-2})\) ,其中 \(c_k=\sum_{i+j=k}a_ib_j\)
系数表示法时计算是 \(O(n^2)\) 的
但是对于两个点值表达式的多项式,可以 \(O(n)\) 的计算出多项式乘积
便得出了 FFT 的三个步骤
- 系数表示法转为点值表示法, \(DFT,O(n\log n)\)
- 点值表示法相乘, \(O(n)\)
- 点值表示法转为系数表示法, \(IDFT,O(n\log n)\)
复数 Complex
复数由实部和虚部构成,可用二元组 \((a,b)\) 表示复数 \(a+bi,i^2=-1\) 可将其理解为一个点或向量
加法
\((a_1,b_1)+(a_2,b_2)=(a_1+a_2,b_1+b_2)\)
减法
\((a_1,b_1)-(a_2,b_2)=(a_1-a_2,b_1-b_2)\)
乘法
\((a+bi)(c+di)=(ac-bd)+(bc+ad)i=(ac-bd,bc+ad)\)
除法
共轭复数:实部相同,虚部互为相反数的两个复数, \(z(a,b)=a+bi\) 的共轭复数为 \(\bar z(a,-b)=(a-bi)\)
有趣的性质:对于一个 \(z=(a,b)\) , \(|z|=|\bar z|,z\cdot\bar z=a^2+b^2\)
\(\dfrac{a+bi}{c+di}=\dfrac{(a+bi)(c-di)}{(c+di)(c-di)}=\dfrac{ac+bd}{c^2+d^2}+\dfrac{bc-ad}{c^2+d^2}i\)
单位根
将单位圆(以原点为圆心,半径为 1)n 等分,得到 n 个模长为 1 的复数
将点从 0 开始标号,设第 0 个点为 \(\omega_n^0\) 以此类推
以 (1,0) 为起点,则 \(\omega_n^i=(\cos(\dfrac{i}{n}2\pi),\sin(\dfrac{i}{n}2\pi))\) (用弧度制)
把这些复数称为 n 次单位根
性质:\(\omega_n^n=1,\omega_n^k=\omega_n^{2k},\omega_{n}^{k+\frac{n}{2}}=-\omega_{n}^k\)
DFT
将系数表达式转化为点值表达式,就 DFT 来说,它分治地来求当 \(x=\omega_n^k\) 的时候 \(F(x)\) 的值
使 \(n=2^m\) ,不够位就补,不会对答案有影响
对于多项式 \(A(x)=\sum_{i=0}^{n-1}a_ix^i\) ,将其按下标奇偶性分类
\(A(x)=(a_0+a_2x^2+\cdot\cdot\cdot+a_{n-2}x^{n-2})+(a_1x+a_3x^3+\cdot\cdot\cdot+a_{n-1}x^{n-1})\)
现在设 \(A_1(x)=(a_0+a_2x+\cdot\cdot\cdot+a_{n-2}x^{\frac{n-2}{2}}),A_2(x)=(a_1+a_3x+\cdot\cdot\cdot+a_{n-1}x{\frac{n-2}{2}})\)
则 \(A(x)=A_1(x^2)+xA_2(x^2)\)
对于 \(k<\dfrac{n}{2}\) 有 \(A(\omega_n^k)=A_1(\omega_n^{2k})+\omega_n^kA_2(\omega_n^{2k})\\ =A_1(\omega_{\frac{n}{2}}^k)+\omega_n^kA_2(\omega_{\frac{n}{2}}^k)\)
对于 \(k+\dfrac{n}{2}\) 有 \(A(\omega_n^{k+\frac{n}{2}})=A_1(\omega_n^{2k+n})+\omega_n^{k+\frac{n}{2}}A_2(\omega_n^{2k+n})\\\ =A_1(\omega_{\frac{n}{2}}^k*\omega_n^n)+\omega_n^k*\omega_n^{\frac{n}{2}}A_2(\omega_{\frac{n}{2}}^k*\omega_n^n)\)
因为 \(\omega_n^n=(1,0),\omega_n^{\frac{n}{2}}=(-1,0)\) 所以 \(A(\omega_n^{k+\frac{n}{2}})=A_1(w_{\frac{n}{2}}^k)-w_n^kA_2(w_{\frac{n}{2}}^k)\)
于是问题被分解成了更小的子问题,递归求解即可
时间复杂度 \(O(n\log n)\)
IDFT
将点值表达式转回为系数表达式
以下内容摘自 OI-Wiki
已知 \(y_i=F(\omega_n^i),i\in[0,n)\) 求 \(\{a_0,a_1,\cdot\cdot\cdot,a_{n-1}\}\) 。构造式是:\(A(x)=\sum_{i=0}^{n-1}y_ix^i\)
相当于把 \(\{y_0,y_1,\cdot\cdot\cdot,y_{n-1}\}\) 当作多项式 \(A\) 的系数表示法,设 \(b_i=\omega_n^{-i}\)
则多项式 \(A\) 在 \(x=b_0,b_1,\cdots,b_{n-1}\) 处的点值表示法为 \(\{A(b_0),A(b_1),\cdots\,A(b_{n-1})\}\)
对 \(A(x)\) 的定义式做一下变换,可以将 \(A(b_k)\) 表示为
A(b_k) &= \sum_{i=0}^{n-1}F(\omega_n^i)\omega_n^{-ik}
=\sum_{i=0}^{n-1}\omega_n^{-ik}\sum_{j=0}^{n-1}a_j(\omega_n^i)^j \\
&= \sum_{i=0}^{n-1}\sum_{j=0}^{n-1}a_j\omega_n^{i(j-k)}
=\sum_{j=0}^{n-1}a_j\sum_{i=0}^{n-1}(\omega_n^{j-k})^i
\end{aligned}
\]
记 \(S(\omega_n^a)=\sum_{i=0}^{n-1}(\omega_n^a)^i\)。当 \(a=0\) 时,\(S(\omega_n^a)=n\);当 \(a\ne0\) 时,错位相减
S(\omega_n^a) &= \sum_{i=0}^{n-1}(\omega_n^a)^i \\
\omega_n^a S(\omega_n^a) &= \sum_{i=1}^n (\omega_n^a)^i\\
S(\omega_n^a) &= \dfrac{(\omega_n^a)^n-(\omega_n^a)^0}{\omega_n^a-1}=0
\end{aligned}
\]
也就是说 \(S(\omega_n^a)=\left\{\begin{aligned}n,a=0\\0,a\ne0\end{aligned}\right.\),那么代回原式\(A(b_k)=\sum_{j=0}^{n-1}a_jS(\omega_n^{j-k})=a_k\cdot n\)
也就是说给定 $b_i=\omega_n^{-i},则 $ \(A\) 的点值表示法为
\(\{(b_0,A(b_0)),(b_1,A(b_1)),\cdots,(b_{n-1},A(b_{n-1}))\}\)
\(=\{(b_0,a_0\cdot n),(b_1,a_1\cdot n,\cdots,(b_{n-1},a_{n-1}\cdot n\}\)
综上所述,我们取单位根为其倒数,对 \(\{y_0,y_1,\cdots,y_{n-1}\}\) 跑一遍 FFT ,然后除以 n 即可得到 \(F(x)\) 的系数表示法。
迭代实现
然而,如果直接用递归来打,本蒟蒻会因为自带的 \(O(\infin)\) 大常数被卡死。
可以研究以下序列变换过程
0 1 2 3 4 5 6 7
0 2 4 6 | 1 3 5 7
0 4 | 2 6 | 1 5 | 3 7
这时候发现:最终序列为原顺序二进制下的反转,直接模拟从下往上合并
可以用递推来预处理
\(\lfloor\dfrac{x}{2}\rfloor\) 的翻转值是已知的,而这个值右移一位就是 x 除了二进制个位的翻转值
若个位是 0 ,反转后最高位就是 0,否则最高位就是 1
Code
#include<bits/stdc++.h>
using namespace std;
const int N=2100000;
const double PI=acos(-1.0);
struct Comp {
double x,y;
inline Comp(double p=0.0,double q=0.0):x(p),y(q) { }
inline Comp operator +(Comp o) { return Comp(x+o.x,y+o.y); }
inline Comp operator -(Comp o) { return Comp(x-o.x,y-o.y); }
inline Comp operator *(Comp o) { return Comp(x*o.x-y*o.y,x*o.y+y*o.x); }
}x[N],y[N];
int r[N];
inline void FFT(Comp *a,int n,int on) {
register int i,j,k;
register Comp wn,w,x,y;
for(i=1;i<=n;i++)
if(i<r[i])swap(a[i],a[r[i]]);
for(i=1;i<n;i<<=1) {
wn=Comp(cos(PI/i),on*sin(PI/i));
for(j=0;j<n;j+=(i<<1)) {
w=Comp(1,0);
for(k=0;k<i;k++,w=w*wn) {
x=a[j+k],y=w*a[i+j+k];
a[j+k]=x+y,a[i+j+k]=x-y;
}
}
}
if(on==-1)
for(i=0;i<=n;i++)
a[i].x=floor(a[i].x/n+0.5);
}
int n,m,lim,L;
int main() {
scanf("%d%d",&n,&m);
for(int i=0;i<=n;i++)scanf("%lf",&x[i].x);
for(int i=0;i<=m;i++)scanf("%lf",&y[i].x);
for(lim=1,L=-1;lim<=n+m;lim<<=1,++L);
for(int i=0;i<lim;i++)r[i]=(r[i>>1]>>1)|((i&1)<<L);
FFT(x,lim,1),FFT(y,lim,1);
for(int i=0;i<lim;i++)x[i]=x[i]*y[i];
FFT(x,lim,-1);
for(int i=0;i<=n+m;i++)printf("%d ",(int)x[i].x);
}
三步变两步优化
原方法中求了三次 FFT ,由于本蒟蒻常数较大,三次不是特别快
我们可以把 \(B(x)\) 放到 \(A(x)\) 的虚部上去,求出 \(A(x)^2\),然后把 \(A(x)\) 的虚部取出来除 2 就是答案了
正确性的证明:\((a+bi)^2=(a^2-b^2)+(2abi)\)
这样的话效率是原来的 \(\dfrac{2}{3}\)
#include<bits/stdc++.h>
using namespace std;
const int N=2100000;
const double PI=acos(-1.0);
struct Comp {
double x,y;
inline Comp(double p=0.0,double q=0.0):x(p),y(q) { }
inline Comp operator +(Comp o) { return Comp(x+o.x,y+o.y); }
inline Comp operator -(Comp o) { return Comp(x-o.x,y-o.y); }
inline Comp operator *(Comp o) { return Comp(x*o.x-y*o.y,x*o.y+y*o.x); }
}x[N];
int r[N];
inline void FFT(Comp *a,int n,int on) {
register int i,j,k;
register Comp wn,w,x,y;
for(i=1;i<=n;i++)
if(i<r[i])swap(a[i],a[r[i]]);
for(i=1;i<n;i<<=1) {
wn=Comp(cos(PI/i),on*sin(PI/i));
for(j=0;j<n;j+=(i<<1)) {
w=Comp(1,0);
for(k=0;k<i;k++,w=w*wn) {
x=a[j+k],y=w*a[i+j+k];
a[j+k]=x+y,a[i+j+k]=x-y;
}
}
}
if(on==-1)
for(i=0;i<=n;i++)
a[i].x=floor(a[i].x/n+0.5),
a[i].y=floor(a[i].y/n/2+0.5);
}
int n,m,lim,L;
int main() {
scanf("%d%d",&n,&m);
for(int i=0;i<=n;i++)scanf("%lf",&x[i].x);
for(int i=0;i<=m;i++)scanf("%lf",&x[i].y);
for(lim=1,L=-1;lim<=n+m;lim<<=1,++L);
for(int i=0;i<lim;i++)r[i]=(r[i>>1]>>1)|((i&1)<<L);
FFT(x,lim,1);
for(int i=0;i<lim;i++)x[i]=x[i]*x[i];
FFT(x,lim,-1);
for(int i=0;i<=n+m;i++)printf("%d ",(int)x[i].y);
}
FFT 小记的更多相关文章
- 分治FFT小记🐤
分治FFT:在 $O(n \log^2 n)$ 的时间内求出类似于 $f_i=\sum\limits_{j=0}^{i-1}g(i-j)f(j)$ 之类的递推式 思想:同 CDQ 分治的思想,先分成左 ...
- 快速傅里叶变换FFT学习小记
FFT学得还是有点模糊,原理那些基本还是算有所理解了吧,不过自己推这个推不动. 看的资料主要有这两个: http://blog.miskcoo.com/2015/04/polynomial-multi ...
- AtCoder Grand Contest 1~10 做题小记
原文链接https://www.cnblogs.com/zhouzhendong/p/AtCoder-Grand-Contest-from-1-to-10.html 考虑到博客内容较多,编辑不方便的情 ...
- FFT/NTT复习笔记&多项式&生成函数学习笔记Ⅲ
第三波,走起~~ FFT/NTT复习笔记&多项式&生成函数学习笔记Ⅰ FFT/NTT复习笔记&多项式&生成函数学习笔记Ⅱ 单位根反演 今天打多校时 1002 被卡科技了 ...
- [原]Paste.deploy 与 WSGI, keystone 小记
Paste.deploy 与 WSGI, keystone 小记 名词解释: Paste.deploy 是一个WSGI工具包,用于更方便的管理WSGI应用, 可以通过配置文件,将WSGI应用加载起来. ...
- 并行计算提升32K*32K点(32位浮点数) FFT计算速度(4核八线程E3处理器)
对32K*32K的随机数矩阵进行FFT变换,数的格式是32位浮点数.将产生的数据存放在堆上,对每一行数据进行N=32K的FFT,记录32K次fft的时间. 比较串行for循环和并行for循环的运行时间 ...
- 【BZOJ-2179&2194】FFT快速傅里叶&快速傅里叶之二 FFT
2179: FFT快速傅立叶 Time Limit: 10 Sec Memory Limit: 259 MBSubmit: 2978 Solved: 1523[Submit][Status][Di ...
- 为什么FFT时域补0后,经FFT变换就是频域进行内插?
应该这样来理解这个问题: 补0后的DFT(FFT是DFT的快速算法),实际上公式并没变,变化的只是频域项(如:补0前FFT计算得到的是m*2*pi/M处的频域值, 而补0后得到的是n*2*pi/N处的 ...
- MySql 小记
MySql 简单 小记 以备查看 1.sql概述 1.什么是sql? 2.sql发展过程? 3.sql标准与方言的关系? 4.常用数据库? 5.MySql数据库安装? 2.关键概念 表结构----- ...
随机推荐
- java基础-java异常处理
异常* A:异常的概述 * 异常就是Java程序在运行过程中出现的错误.* B:异常的分类 * Error:服务器宕机,数据库崩溃等 * ExceptionC:异常的继承体系 * Throwable ...
- vue报错解决方案
Vue build faild 解决办法: https://blog.csdn.net/u011169370/article/details/83346176 ? jbcmVideo git:(oah ...
- docker下将容器按照端口号分配
问题情境:现在有一个服务器主机,安装了docker,想给成员分配各自的容器,但不想成员通过宿主机进入容器.那么成员如何直接访问容器呢? 成员可以通过ip加端口号访问 因此,需要生成一个容器,将容器的2 ...
- Java数组的常见算法2
1. 求数值型数组中元素的最大值.最小值.平均值.总值等 2. 数组的复制.反转.查找(线性查找.二分法查找)
- python入门基础—安装
说明:0基础,那就先练习python语言基础知识,等基础知识牢固了,再对各开发平台分别进行介绍.这里只介绍两个简单而又容易搭建开发平台Anaconda和pycharm Anaconda是一个开源的Py ...
- 共读《redis设计与实现》-数据结构篇
准备将之前攒下的书先看一遍,主要是有个大概的了解,以后用的时候也知道在哪里找.所以准备开几篇共读的帖子,激励自己多看一些书. Redis 基于 简单动态字符串(SDS).双端链表.字典.压缩列表.整数 ...
- Java-GUI 编程之 Swing
Swing概述 实际使用 Java 开发图形界面程序时 ,很少使用 AWT 组件,绝大部分时候都是用 Swing 组件开发的 . Swing是由100%纯 Java实现的,不再依赖于本地平台的 GU ...
- python matplotlib在mac os x 中如何显示中文,完美解决
一. 下载相关的中文字体 simhei 文件: 下载地址 二.通过以下代码查找matplotlib的数据存放位置: import matplotlib print(matplotlib.matplot ...
- [笔记] $f(i)$ 为 $k$ 次多项式,$\sum_{i=0}^nf(i)\cdot q^i$ 的 $O(k\log k)$ 求法
\(f(i)\) 为 \(k\) 次多项式,\(\sum_{i=0}^nf(i)\cdot q^i\) 的 \(O(k\log k)\) 求法 令 \(S(n)=\sum_{i=0}^{n-1}f(i ...
- Nginx编译安装及常用命令
一个执着于技术的公众号 前言 前面我们已经了解Nginx基础入门知识,今天就带大家一起学习下Nginx编译安装部署 准备工作 一台linux机器(本次实验以CentOS 7.5为例) 到Nginx官方 ...