P4723 【模板】常系数齐次线性递推

题目描述

求一个满足$k$阶齐次线性递推数列${a_i}$的第$n$项。

即:$a_n=\sum\limits_{i=1}^{k}f_i \times a_{n-i}$

输入输出格式

输入格式:

第一行两个数$n$,$k$,如题面所述。

第二行$k$个数,表示$f_1 \ f_2 \ \cdots \ f_k$

第三行$k$个数,表示$a_0 \ a_1 \ \cdots \ a_{k-1}$

输出格式:

一个数,表示 $a_n \% 998244353$ 的值

输入输出样例

输入样例#1:
复制

6 4
3 -1 0 4
-2 3 1 5
输出样例#1:
复制

73

说明

$N = 10^{9} , K = 32000$

题解

先修《数学选修4-2:矩阵与变换》。

常系数线性递推

给出递推式\(f_n=\sum_{i=1}^ka_if_{n-i}\),和初值条件\(f_1,f_2,\dots ,f_k\),求\(f_n\)。

可以用生成函数解一下,然后多项式求逆,\(O(n\log n)\)。当然这对于\(n=10^9\)的数据范围是不行的。

矩阵快速幂解法

由递推式,构造矩阵和列向量

\[A=\begin{bmatrix}
0 & 1 & 0 & \dots & 0\\
0 & 0 & 1 & \dots & 0\\
0 & 0 & 0 & \dots & 0\\
\vdots & \vdots & \vdots & \ddots & \vdots\\
0 & 0 & 0 & \dots & 1\\
a_k & a_{k-1} & a_{k-2} & \dots & a_1
\end{bmatrix}
,F=\begin{bmatrix}
f_1\\
f_2\\
f_3\\
\vdots\\
f_k
\end{bmatrix}
\]

计算\(A^{n-k}F\)即可,\(O(k^3\log n)\)。然而这对于\(k=32000\)的数据范围还是不行。

矩阵的特征值和特征向量

\(A^nF\)是线性变换的形式,自然也可以用特征值与特征向量来求解。

特征多项式是\(f_A(\lambda)=|A-\lambda I|\),于是特征方程为

\[\det\begin{bmatrix}
-\lambda & 1 & 0 & \dots & 0\\
0 & -\lambda & 1 & \dots & 0\\
\vdots & \vdots & \vdots & \ddots & \vdots\\
0 & 0 & 0 & \dots & 1\\
a_k & a_{k-1} & a_{k-2} & \dots & a_1-\lambda
\end{bmatrix}=0
\]

手动高斯消元,消成上三角可得

\[(a_1-\lambda+\frac{a_2}{\lambda}+\frac{a_3}{\lambda^2}+\dots+\frac{a_{k}}{\lambda^{k-1}})(-\lambda)^{k-1}=0\\
a_k+a_{k-1}\lambda+a_{k-2}\lambda^2+\dots+a_1\lambda^{k-1}=\lambda^k
\]

然后呢,把特征值解出来然后用特征向量那套理论吗?虽然这种方法可行,但是只能做低次的(4次及以下),所以我们需要新科技。

矩阵的多项式

对于\(n\)次多项式\(f(x)\),将矩阵\(A\)看做自变量带入,得

\[f(A)=a_0E+\sum_{i=1}^na_iA^i
\]

记\(f(A)\)为\(A\)的\(n\)次多项式。与另一个\(A\)的\(m\)次多项式\(g(A)\),其乘法运算满足交换律,即

\[f(A)g(A)=g(A)f(A)
\]

Cayley-Hamilton 定理

特征多项式\(f_A(x)=\sum_{i=0}^{k-1}a_{k-i}x^i-x^k\),这里注意下标。

定理:\(f_A(A)=0\),即矩阵被自己的特征多项式化零。记忆方法:\(f_A(A)=|A-AI|=0\)。

推论:\(A^n=q(A)f_A(A)+r(A)=r(A)\),其中\(r(A)=A^n\mod f_A(A)\)。

所以\(A^nF=r(A)F=\sum_{i=0}^{k-1}r_iA^iF\),\(O(k^4)\)。???

多项式优化

将Cayley-Hamilton定理的推论变成普通多项式:\(x^n=q(x)f_A(x)+r(x)\),其中\(r(x)=x^n\mod f_A(x)\)。

于是我们可以对多项式\(x\)做快速幂并取模\(f_A(x)\),即可得出\(r(x)\)的系数,即\(r(A)\)的系数,\(O(k\log k\log n)\)。

而\(A^iF=\begin{bmatrix}f_{1+i} & f_{2+i} & \dots & f_{k+i}\end{bmatrix}^T\),所以\(f_{n+k}=\sum_{i=0}^{k-1}r_if_{k+i}\)。

问题转化成了如何求\(f\)的前\(2k\)项。这时使用生成函数和多项式求逆,\(O(k\log k)\)。

于是我们便得到了\(O(k\log k\log n+k\log k+k)\)的优秀解法。

小优化

刚才说的快速幂是指\(A^{n-k}\),如果我们做到\(A^{n-1}\),就只需要前\(k\)项了,那么就用不着什么生成函数了。\(O(k\log k\log n+k)\)。

UPD:然后我发现\(a_i\)系数要翻转,还要取相反数,是我把特征方程写反了?的确数学书上的应该是\(|\lambda I-A|\),但这没有影响。我看差异是我和其他人转移矩阵列的不一样,我把他们的做了一个中心对称(这是讲义的风格),然后特征方程都不一样了?我觉得这不是我以现有的水平能搞明白的问题。但是大众的写法的优势在于他们的最高次项系数为1,在做暴力多项式取模的时候很好办。

UPD:最近我发现最开始的那个矩阵含有 \(a\) 的最后一行写反了……

void num_trans(polynomial&a,int inverse){
int limit=a.size(),len=log2(limit);
static vector<int> bit_rev;
if(bit_rev.size()!=limit){
bit_rev.resize(limit);
for(int i=0;i<limit;++i) bit_rev[i]=bit_rev[i>>1]>>1|(i&1)<<(len-1);
}
for(int i=0;i<limit;++i)if(i<bit_rev[i]) swap(a[i],a[bit_rev[i]]);
for(int step=1;step<limit;step<<=1){
int gn=fpow(inverse==1?g:g_inv,(mod-1)/(step<<1));
for(int even=0;even<limit;even+=step<<1){
int odd=even+step,gk=1;
for(int k=0;k<step;++k,gk=mul(gk,gn)){
int t=mul(gk,a[odd+k]);
a[odd+k]=add(a[even+k],mod-t),a[even+k]=add(a[even+k],t);
}
}
}
if(inverse==-1){
int lim_inv=fpow(limit,mod-2);
for(int i=0;i<limit;++i) a[i]=mul(a[i],lim_inv);
}
}
polynomial poly_inv(polynomial a,int n){ // mod x^n
polynomial b(1,fpow(a[0],mod-2));
if(n==1) return b;
int limit;
for(limit=2;limit<n;limit<<=1){
polynomial a1(a.begin(),a.begin()+limit);
a1.resize(limit<<1),num_trans(a1,1);
b.resize(limit<<1),num_trans(b,1);
for(int i=0;i<limit<<1;++i) b[i]=mul(add(2,mod-mul(a1[i],b[i])),b[i]);
num_trans(b,-1),b.resize(limit);
}
a.resize(limit<<1),num_trans(a,1);
b.resize(limit<<1),num_trans(b,1);
for(int i=0;i<limit<<1;++i) b[i]=mul(add(2,mod-mul(a[i],b[i])),b[i]);
num_trans(b,-1),b.resize(n);
return b;
}
polynomial poly_div(polynomial f,polynomial g){ // return the quotient
int n=f.size()-1,m=g.size()-1;
reverse(g.begin(),g.end()),g.resize(n-m+1),g=poly_inv(g,n-m+1);
reverse(f.begin(),f.end()),f.resize(n-m+1);
int limit=1<<int(ceil(log2(2*(n-m)+1)));
f.resize(limit),g.resize(limit);
num_trans(f,1),num_trans(g,1);
for(int i=0;i<limit;++i) f[i]=mul(f[i],g[i]);
num_trans(f,-1),f.resize(n-m+1);
return reverse(f.begin(),f.end()),f;
}
polynomial poly_mod(polynomial f,polynomial g){ // return the reminder
int n=f.size()-1,m=g.size()-1;
polynomial q=poly_div(f,g);
int limit=1<<int(ceil(log2(n+1)));
g.resize(limit),q.resize(limit);
num_trans(g,1),num_trans(q,1);
for(int i=0;i<limit;++i) g[i]=mul(g[i],q[i]);
num_trans(g,-1);
for(int i=0;i<m;++i) f[i]=add(f[i],mod-g[i]);
return f.resize(m),f;
} int n,k;
void mul(polynomial&a,polynomial b,co polynomial&p){
static co int limit=1<<int(ceil(log2(2*k-1)));
a.resize(limit),b.resize(limit);
num_trans(a,1),num_trans(b,1);
for(int i=0;i<limit;++i) a[i]=mul(a[i],b[i]);
num_trans(a,-1),a.resize(2*k-1);
a=poly_mod(a,p);
}
int main(){
read(n),read(k);
polynomial a(k),f(k);
for(int i=1;i<=k;++i) a[k-i]=(mod-read<int>()%mod)%mod; // [-1e9,1e9]
for(int i=0;i<k;++i) f[i]=(read<int>()%mod+mod)%mod;
if(n<k) return printf("%d\n",f[n]),0;
a.push_back(1);
polynomial rmd(1,1),tmp(2);tmp[1]=1;
for(;n;n>>=1,mul(tmp,tmp,a))
if(n&1) mul(rmd,tmp,a);
int ans=0;
for(int i=0;i<k;++i) ans=add(ans,mul(rmd[i],f[i]));
printf("%d\n",ans);
return 0;
}

LG4723 【模板】常系数线性递推的更多相关文章

  1. 【BZOJ4944】【NOI2017】泳池 概率DP 常系数线性递推 特征多项式 多项式取模

    题目大意 有一个\(1001\times n\)的的网格,每个格子有\(q\)的概率是安全的,\(1-q\)的概率是危险的. 定义一个矩形是合法的当且仅当: 这个矩形中每个格子都是安全的 必须紧贴网格 ...

  2. 51nod1538:一道难题(常系数线性递推/Cayley-Hamilton定理)

    传送门 Sol 考虑要求的东西的组合意义,问题转化为: 有 \(n\) 种小球,每种的大小为 \(a_i\),求选出大小总和为 \(m\) 的小球排成一排的排列数 有递推 \(f_i=\sum_{j= ...

  3. Cayley-Hamilton定理与矩阵快速幂优化、常系数线性递推优化

    原文链接www.cnblogs.com/zhouzhendong/p/Cayley-Hamilton.html Cayley-Hamilton定理与矩阵快速幂优化.常系数线性递推优化 引入 在开始本文 ...

  4. 【XSY2730】Ball 多项式exp 多项式ln 多项式开根 常系数线性递推 DP

    题目大意 一行有\(n\)个球,现在将这些球分成\(k\) 组,每组可以有一个球或相邻两个球.一个球只能在至多一个组中(可以不在任何组中).求对于\(1\leq k\leq m\)的所有\(k\)分别 ...

  5. 常系数线性递推的第n项及前n项和 (Fibonacci数列,矩阵)

      (一)Fibonacci数列f[n]=f[n-1]+f[n-2],f[1]=f[2]=1的第n项的快速求法(不考虑高精度). 解法: 考虑1×2的矩阵[f[n-2],f[n-1]].根据fibon ...

  6. 模板 - 线性递推BM

    模数是998244353的话好像NTT可以更快. #include<bits/stdc++.h> using namespace std; typedef long long ll; co ...

  7. [模板]线性递推+BM

    暴力版本: #include<bits/stdc++.h> #define mod 998244353 using namespace std; typedef long long int ...

  8. CF1106F Lunar New Year and a Recursive Sequence 线性递推 + k次剩余

    已知\(f_i = \prod \limits_{j = 1}^k f_{i - j}^{b_j}\;mod\;998244353\),并且\(f_1, f_2, ..., f_{k - 1} = 1 ...

  9. Codeforces 1106F Lunar New Year and a Recursive Sequence (数学、线性代数、线性递推、数论、BSGS、扩展欧几里得算法)

    哎呀大水题..我写了一个多小时..好没救啊.. 数论板子X合一? 注意: 本文中变量名称区分大小写. 题意: 给一个\(n\)阶递推序列\(f_k=\prod^{n}_{i=1} f_{k-i}b_i ...

随机推荐

  1. Linux 中的 ~/. 表示的意思

    在Linux中, ~ 表示用户的目录, 如用户名是Gavin, 那么~/表示  /home/Gavin 所以~/. 表示 用户目录下的隐藏文件. 扩展: 若以用户身份登录 ~ 表示 /home  目录 ...

  2. nRF24L01P数据传输速率

    项目要用nRF24L01P做语音的传输,数据量可想而知. 发送端按照8KHz/s采样率,每次采样双声道,16位深度(2Bytes). 数据量算一下就是8000x2x2=32000(Bytes) nRF ...

  3. 【LEETCODE】46、999. Available Captures for Rook

    package y2019.Algorithm.array; /** * @ProjectName: cutter-point * @Package: y2019.Algorithm.array * ...

  4. 状态机的Verilog写法

    “硬件设计很讲究并行设计思想,虽然用Verilog描述的电路大都是并行实现的,但是对于实际的工程应用,往往需要让硬件来实现一些具有一定顺序的工作,这就要用到状态机思想.什么是状态机呢?简单的说,就是通 ...

  5. 微信H5页面前端开发,大多数人都会遇到的几个兼容性坑

    最近给公司微信公众号,写了微信h5业务页面,总结分享一下前端开发过程中的几个兼容性坑,项目直接拿的公司页面,所以下文涉及图片都模糊处理了. 1.ios端兼容input光标高度 问题详情描述:input ...

  6. jmeter_分布式测试

    背景:         由于Jmeter本身的瓶颈,当需要模拟数以千计的并发用户时,使用单台机器模拟所有的并发用户就有些力不从心,甚至还会引起JAVA内存溢出的错误.要解决这个问题,可以使用分布式实测 ...

  7. WPF内嵌网页的两种方式

    在wpf程序中,有时会内嵌网页.内嵌网页有两种方法,一种是使用wpf自带WebBrowser控件来调用IE内核,另一种是使用CefSharp包来调用chrom内核. 一.第一种使用自带WebBrows ...

  8. Java隐式类型转换和强制类型转换

    一.强制类型转换 char 和 整型之间的类型转换 char a7 = 'a'; System.out.println(a7); System.out.println( (int)a7 ); Syst ...

  9. 使用CertUtil.exe下载远程文件

    使用CertUtil.exe下载远程文件 证书 https://www.cnblogs.com/17bdw/p/8728656.html 1.前言 经过国外文章信息,CertUtil.exe下载恶意软 ...

  10. Java调用WebService方法总结(8)--soap.jar调用WebService

    Apache的soap.jar是一种历史很久远的WebService技术,大概是2001年左右的技术,所需soap.jar可以在http://archive.apache.org/dist/ws/so ...