[gym102978D]Do Use FFT

前置知识

（以下内容并不严谨，可以参考论文《转置原理的简单介绍》）

对于一个算法，其为线性算法当且仅当仅包含以下操作：

1.$read\ i$，将$r_{i}$的值赋为（下一个）读入的元素

2.$write\ i$，将$r_{i}$的值赋给（下一个）输出的元素

3.$update\ i\ j\ c$，将$r_{i}$的值修改为$r_{i}+c\cdot r_{j}$（其中$c$为常数）

其中$r_{i}$表示第$i$个变量，初值均为0

由此，线性算法即可用一个操作序列描述

假设有$n$次$read$操作和$m$次$write$操作，不妨强制这$n$次$read$和$m$次$write$操作分别严格在$update$之前和之后（以下$n,m$意义默认为此意义，且保证此性质）

结论1：对于线性算法，恰存在一个$m\times n$的矩阵$A$——若将读入的$n$个元素和输出的$m$个元素分别构成$n\times 1$和$m\times 1$的矩阵$x$和$y$，则$y=Ax$

归纳每一个变量都是$x_{i}$的线性组合即可

进一步的，称该线性算法为矩阵$A$的线性算法

结论2：对于矩阵$A$的线性算法，将其操作序列翻转并将操作依次变为$write\ i,read\ i$和$update\ j\ i\ c$，则得到的线性算法为$A^{T}$的线性算法

操作可以看作不断乘上矩阵$E_{1},E_{2},...,E_{t}$，根据定义$A=\prod_{i=1}^{t}E_{i}$

操作翻转和变化即变为乘上$E_{t}^{T},E_{t-1}^{T},...,E_{1}^{T}$，而注意到$A^{T}=\prod_{i=t}^{1}E_{i}^{T}$，也即成立

题解

令$f_{k}(x)=\prod_{i=1}^{k}(x+b_{i})$，则问题即求$\sum_{i=1}^{n}c_{i}f_{k}(a_{i})$

将其以多项式的形式展开，即$\sum_{i=1}^{n}c_{i}\sum_{j=0}^{n}[x^{j}]f_{k}(x)\cdot a_{i}^{j}$

调换枚举顺序，即$\sum_{j=0}^{n}[x^{j}]f_{k}(x)\sum_{i=1}^{n}c_{i}a_{i}^{j}$

记后者为$S_{j}$，注意到其可以看作$\sum_{i=1}^{n}c_{i}\cdot [x^{j}]\frac{1}{1-a_{i}x}=[x^{j}]\sum_{i=1}^{n}\frac{c_{i}}{1-a_{i}x}$，那么考虑求该多项式，可以对其分治计算，并以分式的形式存储即可（最后再求逆展开）

由此，问题即求$\sum_{i=0}^{n}S_{i}\cdot [x^{i}]f_{k}(x)$

构造矩阵$A_{i,k}=[x^{i}]f_{k}(x)$，并将$S$看作输入矩阵（预处理过程显然独立），那么即需要实现$A$的线性算法，根据转置原理（结论2）不妨去实现$A^{T}$的线性算法

关于$A^{T}$的线性算法，假设读入为$Q$，代入式子即求$\sum_{i=1}^{n}Q_{i}A_{k,i}=[x^{k}]\sum_{i=1}^{n}Q_{i}\prod_{j=1}^{i}(x+b_{j})$

分治，并求出$H(x)=\prod_{j=l}^{r}(x+b_{j})$和$F(x)=\sum_{i=l}^{r}Q_{i}\prod_{j=l}^{i}(x+b_{j})$，则转移如下
$$
\begin{cases}H(x)=H_{l}(x)H_{r}(x)\\F(x)=F_{l}(x)+H_{l}(x)F_{r}(x)\end{cases}
$$
进而$A$的线性算法即将过程"转置"，具体做法如下——

$H(x)$与输入$S$无关，因此可以先预处理出来

$A^{T}$的线性算法中，最后执行的是输出$[x^{i}]F(x)$，那么即需要读入$[x^{i}]F(x)$（注意要求$AS$，即读入为$S$）

分治的形式是从底向上做，那么反过来即要自顶向下做（先执行操作再递归）

下面，来考虑操作的翻转，从后往前依次考虑操作：

1.$[x^{i}]F(x)=[x^{i}]F_{l}(x)+[x^{i}]G(x)$（其中$G(x)=H_{l}(x)F_{r}(x)$），将其表示为形如$update\ i\ j\ c$的操作，再变换后也即$[x^{i}]F_{l}(x)=[x^{i}]G(x)=[x^{i}]F(x)$

2.$ntt(G,-1),[x^{i}]G(x)=[x^{i}]H_{l}(x)\cdot [x^{i}]F_{r}(x),ntt(F_{r},1)$

（注意这只是将整体的顺序调过来，内部并没有翻转）

关于$ntt$内部如何转置，注意到$ntt(a,p)$可以看作将$a$乘上矩阵$A_{i,j}=\omega^{pij}$，联系结论2的证明即需要将该矩阵转置，而显然转置后仍为自身，因此不需要变化

（但注意$ntt(*,-1)$中的除法虽然不在矩阵乘法的范围内，但不取出处理也是正确的）

接下来即仅有第2步，注意到其中$[x^{i}]H_{l}(x)$看作是常数，因此需要先对其ntt（可以看作预处理），因此也即变为$[x^{i}]F_{r}(x)=[x^{i}]H_{l}(x)\cdot [x^{i}]G(x)$

$A^{T}$的线性算法中，最先执行的是将读入$[x^{1}]F(x)=S_{i}$和$[x^{0}]F(x)=b_{i}\cdot [x^{1}]F(x)$，那么将其转置后即需输出$b_{i}\cdot [x^{0}]F(x)+[x^{1}]F(x)$

时间复杂度为$o(n\log^{2}n)$，可以通过

  1 #include<bits/stdc++.h>

  2 using namespace std;

  3 #define N 250005

  4 #define mod 998244353

  5 #define ll long long

  6 #define vi vector<int>

  7 #define L (k<<1)

  8 #define R (L+1)

  9 #define mid (l+r>>1)

 10 int n,a[N],b[N],c[N],rev[1<<20];

 11 vi A[N<<2],B[N<<2],F[N<<2];

 12 int Log(int m){

 13     int n=1;

 14     while (n<m)n<<=1;

 15     return n;

 16 }

 17 int qpow(int n,int m){

 18     int s=n,ans=1;

 19     while (m){

 20         if (m&1)ans=(ll)ans*s%mod;

 21         s=(ll)s*s%mod;

 22         m>>=1;

 23     }

 24     return ans;

 25 }

 26 void init(int n){

 27     for(int i=0;i<n;i++)rev[i]=(rev[i>>1]>>1)+((i&1)*(n>>1));

 28 }

 29 void ntt(vi &a,int n,int p=0){

 30     a.resize(n);

 31     for(int i=0;i<n;i++)

 32         if (i<rev[i])swap(a[i],a[rev[i]]);

 33     for(int i=2;i<=n;i<<=1){

 34         int s=qpow(3,(mod-1)/i);

 35         if (p)s=qpow(s,mod-2);

 36         for(int j=0;j<n;j+=i)

 37             for(int k=0,ss=1;k<(i>>1);k++,ss=(ll)ss*s%mod){

 38                 int x=a[j+k],y=(ll)ss*a[j+k+(i>>1)]%mod;

 39                 a[j+k]=(x+y)%mod,a[j+k+(i>>1)]=(x-y+mod)%mod;

 40             }

 41     }

 42     if (p){

 43         int s=qpow(n,mod-2);

 44         for(int i=0;i<n;i++)a[i]=(ll)a[i]*s%mod;

 45     }

 46 }

 47 vi mul(vi a,vi b,int m){

 48     int n=Log(m<<1);

 49     if (m<0)m=a.size()+b.size()-1,n=Log(m);

 50     init(n);

 51     for(int i=m;i<a.size();i++)a[i]=0;

 52     for(int i=m;i<b.size();i++)b[i]=0;

 53     ntt(a,n),ntt(b,n);

 54     vi ans;

 55     for(int i=0;i<n;i++)ans.push_back((ll)a[i]*b[i]%mod);

 56     ntt(ans,n,1);

 57     for(int i=m;i<n;i++)ans.pop_back();

 58     return ans;

 59 }

 60 vi inv(vi a,int n){

 61     vi ans;

 62     if (n==1){

 63         ans.push_back(qpow(a[0],mod-2));

 64         return ans;

 65     }

 66     vi s=inv(a,(n>>1));

 67     ans=mul(a,s,n);

 68     for(int i=0;i<n;i++)ans[i]=mod-ans[i];

 69     ans[0]+=2;

 70     return mul(s,ans,n);

 71 }

 72 void get_S(int k,int l,int r){

 73     if (l==r){

 74         A[k].push_back(c[l]);

 75         B[k].push_back(1),B[k].push_back(mod-a[l]);

 76         return;

 77     }

 78     get_S(L,l,mid),get_S(R,mid+1,r);

 79     int m=B[L].size()+B[R].size()-1,n=Log(m);

 80     init(n);

 81     ntt(A[L],n),ntt(A[R],n),ntt(B[L],n),ntt(B[R],n);

 82     for(int i=0;i<n;i++){

 83         A[k].push_back(((ll)A[L][i]*B[R][i]+(ll)A[R][i]*B[L][i])%mod);

 84         B[k].push_back((ll)B[L][i]*B[R][i]%mod);

 85     }

 86     ntt(A[k],n,1),ntt(B[k],n,1);

 87     for(int i=m;i<n;i++){

 88         A[k].pop_back();

 89         B[k].pop_back();

 90     }

 91 }

 92 void get_H(int k,int l,int r){

 93     if (l==r){

 94         B[k].clear();

 95         B[k].push_back(b[l]),B[k].push_back(1);

 96         return;

 97     }

 98     get_H(L,l,mid),get_H(R,mid+1,r);

 99     B[k]=mul(B[L],B[R],-1);

100 }

101 void get_F(int k,int l,int r){

102     if (l==r){

103         printf("%d\n",((ll)b[l]*F[k][0]+F[k][1])%mod);

104         return;

105     }

106     F[L]=F[R]=F[k];

107     int m=B[L].size(),n=F[L].size();

108     for(int i=m;i<n;i++)F[L].pop_back();

109     m+=B[R].size()-1,n=Log(m);

110     init(n);

111     ntt(B[L],n),ntt(F[R],n,1);

112     for(int i=0;i<n;i++)F[R][i]=(ll)F[R][i]*B[L][i]%mod;

113     ntt(F[R],n);

114     m=B[R].size();

115     for(int i=m;i<n;i++)F[R].pop_back();

116     get_F(L,l,mid),get_F(R,mid+1,r);

117 }

118 int main(){

119     scanf("%d",&n);

120     for(int i=1;i<=n;i++)scanf("%d",&a[i]);

121     for(int i=1;i<=n;i++)scanf("%d",&b[i]);

122     for(int i=1;i<=n;i++)scanf("%d",&c[i]);

123     get_S(1,1,n);

124     A[1]=mul(A[1],inv(B[1],Log(n+1)),n+1);

125     get_H(1,1,n);

126     F[1]=A[1],get_F(1,1,n);

127     return 0;

128 }

[gym102978D]Do Use FFT的更多相关文章

并行计算提升32K*32K点（32位浮点数） FFT计算速度（4核八线程E3处理器）
对32K*32K的随机数矩阵进行FFT变换,数的格式是32位浮点数.将产生的数据存放在堆上,对每一行数据进行N=32K的FFT,记录32K次fft的时间. 比较串行for循环和并行for循环的运行时间 ...
【BZOJ-2179&2194】FFT快速傅里叶&快速傅里叶之二 FFT
2179: FFT快速傅立叶 Time Limit: 10 Sec Memory Limit: 259 MBSubmit: 2978 Solved: 1523[Submit][Status][Di ...
为什么FFT时域补0后，经FFT变换就是频域进行内插？
应该这样来理解这个问题: 补0后的DFT(FFT是DFT的快速算法),实际上公式并没变,变化的只是频域项(如:补0前FFT计算得到的是m*2*pi/M处的频域值, 而补0后得到的是n*2*pi/N处的 ...
FFT NNT
算算劳资已经多久没学新算法了,又要重新开始学辣.直接扔板子,跑...话说FFT算法导论里讲的真不错,去看下就懂了. //FFT#include <cstdio> #include < ...
CC countari & 分块+FFT
题意: 求一个序列中顺序的长度为3的等差数列. SOL: 对于这种计数问题都是用个数的卷积来进行统计.然而对于这个题有顺序的限制,不好直接统计,于是竟然可以分块?惊为天人... 考虑分块以后的序列: ...
ECF R9(632E) & FFT
Description: 上一篇blog. Solution: 同样我们可以用fft来做...就像上次写的那道3-idoit一样,对a做k次卷积就好了. 同样有许多需要注意的地方:我们只是判断可行性, ...
fft练习
数学相关一直都好弱啊>_< 窝这个月要补一补数学啦, 先从基础的fft补起吧! 现在做了道. 窝的fft 模板 (bzoj 2179) #include <iostream> ...
FFT时域与频域的关系，以及采样速率与采样点的影响
首先对于FFT来说,输入的信号是一个按一定采样频率获得的信号序列,而输出是每个采样点对应的频率的幅度(能量). 下面详细分析: 在FFT的输出数据中,第一个值是直流分量的振幅(这样对应周期有无穷的可能 ...
【玩转单片机系列002】如何使用STM32提供的DSP库进行FFT
前些日子,因为需要在STM32F103系列处理器上,对采集的音频信号进行FFT,所以花了一些时间来研究如何高效并精确的在STM32F103系列处理器上实现FFT.在网上找了很多这方面的资料做实验并进行 ...

随机推荐

专访阿里云 Serverless 负责人：无服务器不会让后端失业
2012 年,云基础设施服务提供商 Iron.io 的副总裁 Ken 谈到软件开发行业的未来,首次提出了 Serverless 的概念,为云中运行的应用程序描述了一种全新的系统体系架构.此后,以 AW ...
洛谷3648 [APIO2014]序列分割（斜率优化+dp）
首先对于这个题目. qwq 存在一个性质就是,最终的答案只跟你的分割的位置有关,而和顺序无关. 举一个小栗子 $a\ b\ c$ 将这个东西分成两块. 如果我们先分割$ab$之间的话,\(an ...
Android应用开发特色
目录 Android应用开发特色四大组件 Activity Service Broadcastreceiver Contentprovider 丰富的系统控件 Sqlite数据库强大的多媒体 An ...
Docker--harbor私有仓库部署与管理
目录一.Harbor简介二.Harbor 部署三.维护管理Harbor 一.Harbor简介 1.什么是Harbor ? Harbor 是 VMware 公司开源的企业级 Docker Re ...
ReentrantLock可重入锁、公平锁非公平锁区别与实现原理
ReentrantLock是lock接口的一个实现类,里面实现了可重入锁和公平锁非公平锁 ReentrantLock公平锁和不公平锁实现原理公平锁会获取锁时会判断阻塞队列里是否有线程再等待,若有获取 ...
Linux常用命令，查看树形结构、删除目录（文件夹）、创建文件、删除文件或目录、复制文件或目录（文件夹）、移动、查看文件内容、权限操作
5.查看树结构(tree) 通常情况下系统未安装该命令,需要yum install -y tree安装直接使⽤tree显示深度太多,⼀般会使⽤ -L选项⼿⼯设定⽬录深度格式:tree -L n [ ...
mall笔记
介绍 SpringBoot.SpringCloud.SpringCloudAlibaba.Nacos.Sentinel.Seata整合demo. 软件架构 JDK 1.8 Spring Boot 2. ...
SpringCloud 2020.0.4 系列之Eureka
1. 概述老话说的好:遇见困难,首先要做的是积极的想解决办法,而不是先去泄气.抱怨或生气. 言归正传,微服务是当今非常流行的一种架构方式,其中 SpringCloud 是我们常用的一种微服务框架. ...
PyCharm永久破解方法，2021最新版本！！！
1,下载破解补丁(已更新到2021.1版本): 关注微信公众号<程序员的时光>,回复破解补丁即可: 下载补丁文件 jetbrains-agent.jar 和importat.txt文件并将 ...
java中的软，弱，虚引用介绍与特性分析
java的弱,虚,软引用介绍 1.弱,虚,软引用的介绍对于绝大部分的对象而言,在程序中是存在着一个引用变量引用该对象,这是常见的引用方式,也就是常说的强引用,对于强引用引用的对象,系统JVM是不会 ...

[gym102978D]Do Use FFT

前置知识

题解

[gym102978D]Do Use FFT的更多相关文章

随机推荐

热门专题