模数是998244353的话好像NTT可以更快。

#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int MAXN = 3e5 + 51, MOD = 998244353, G = 3, INVG = 332748118;
int exponent, fd, cnt = 1, limit = -1, rres, ptr;
int rev[MAXN], f[MAXN], g[MAXN], tmp[MAXN], tmp2[MAXN], tmp3[MAXN], tbm[MAXN];
int res[MAXN], base[MAXN], fail[MAXN];
ll delta[MAXN]; inline int read() {
int num = 0;
bool neg = false;
char ch = getchar();
while(!isdigit(ch) && ch != '-')
ch = getchar();
if(ch == '-')
neg = true, ch = getchar();
while(isdigit(ch))
num = (num << 3) + (num << 1) + (ch - '0'), ch = getchar();
return neg ? -num : num;
} inline int qpow(ll x, int n) {
ll res = 1;
for(; n; x = x * x % MOD, n >>= 1)
if(n & 1)
res = res * x % MOD;
return res;
} inline void NTT(int *cp, int cnt, int inv) {
int cur = 0, res = 0;
for(int i = 0; i < cnt; i++)
if(i < rev[i])
swap(cp[i], cp[rev[i]]); for(int i = 2; i <= cnt; i <<= 1) {
cur = i >> 1, res = qpow(inv == 1 ? G : INVG, (MOD - 1) / i);
for(int *p = cp; p != cp + cnt; p += i) {
ll w = 1;
for(int j = 0; j < cur; j++) {
int t = w * p[j + cur] % MOD, t2 = p[j];
p[j + cur] = (t2 - t + MOD) % MOD, p[j] = (t2 + t) % MOD;
w = w * res % MOD;
}
}
} if(inv == -1) {
int invl = qpow(cnt, MOD - 2);
for(int i = 0; i <= cnt; i++)
cp[i] = (ll) cp[i] * invl % MOD;
}
} inline void inv(int fd, int *f, int *res) {
static int tmp[MAXN];
if(fd == 1) {
res[0] = qpow(f[0], MOD - 2);
return;
}
inv((fd + 1) >> 1, f, res);
int cnt = 1, limit = -1;
while(cnt < (fd << 1))
cnt <<= 1, limit++;
for(int i = 0; i < cnt; i++) {
tmp[i] = i < fd ? f[i] : 0;
rev[i] = (rev[i >> 1] >> 1) | ((i & 1) << limit);
}
NTT(tmp, cnt, 1), NTT(res, cnt, 1);
for(int i = 0; i < cnt; i++)
res[i] = 1ll * (2 - 1ll * tmp[i] * res[i] % MOD + MOD) % MOD * res[i] % MOD;
NTT(res, cnt, -1);
for(int i = fd; i < cnt; i++)
res[i] = 0;
} inline void mod(int *f) {
static int tmp[MAXN], q[MAXN];
int deg = fd << 1;
while(!f[--deg]);
if(deg < fd)
return; for(int i = 0; i < cnt; i++)
tmp[i] = i <= deg ? f[i] : 0;
reverse(tmp, tmp + 1 + deg);
for(int i = deg + 1 - fd; i <= deg; tmp[i] = 0, i++);
NTT(tmp, cnt, 1);
for(int i = 0; i < cnt; q[i] = (ll)tmp[i] * tmp3[i] % MOD, i++);
NTT(q, cnt, -1);
for(int i = 0; i < cnt; tmp[i] = 0, q[i] = i <= deg - fd ? q[i] : 0, i++);
reverse(q, q + 1 + deg - fd), NTT(q, cnt, 1);
for(int i = 0; i < cnt; tmp[i] = (ll)q[i] * g[i] % MOD, i++);
NTT(tmp, cnt, -1);
for(int i = 0; i < fd; f[i] = (f[i] - tmp[i] + MOD) % MOD, i++);
for(int i = 0; i < cnt; q[i] = tmp[i] = 0, f[i] = i < fd ? f[i] : 0, i++);
} vector<ll>bmf[MAXN];
inline void BerlekampMassey(int length, int *base, int *res) {
int cur = 0;
for(int i = 1; i <= length; i++) {
ll curr = base[i];
for(int j = 0; j < bmf[cur].size(); j++) {
curr = (curr - (ll)base[i - j - 1] * bmf[cur][j] % MOD) % MOD;
}
delta[i] = curr;
if(!delta[i]) {
continue;
}
fail[cur] = i;
if(!cur) {
bmf[++cur].resize(i), delta[i] = base[i];
continue;
}
int id = cur - 1, x = bmf[id].size() - fail[id] + i;
for(int j = 0; j < cur; j++) {
if(i - fail[j] + bmf[j].size() < x) {
id = j, x = i - fail[j] + bmf[j].size();
}
}
bmf[cur + 1] = bmf[cur], cur++;
while(bmf[cur].size() < x) {
bmf[cur].push_back(0);
}
ll mul = (ll)delta[i] * qpow(delta[fail[id]], MOD - 2) % MOD;
bmf[cur][i - fail[id] - 1] = (ll)(bmf[cur][i - fail[id] - 1] + mul) % MOD;
for(int j = 0; j < bmf[id].size(); j++) {
int t = (ll)mul * bmf[id][j] % MOD;
bmf[cur][i - fail[id] + j] = (bmf[cur][i - fail[id] + j] - t + MOD) % MOD;
}
}
ptr = cur;
for(int i = 0; i < bmf[cur].size(); i++) {
res[i + 1] = (bmf[cur][i] % MOD + MOD) % MOD;
}
}
int main() {
#ifdef Yinku
freopen("Yinku.in", "r", stdin);
#endif // Yinku
fd = read(), exponent = read();
for(int i = 0; i < fd; i++)
tbm[i + 1] = f[i] = (read() + MOD) % MOD; BerlekampMassey(fd, tbm, tmp);
for(int i = 1, ci = bmf[ptr].size(); i <= ci; i++)
printf("%d%c", tmp[i], " \n"[i == ci]); for(int i = 1; i <= fd; g[fd - i] = MOD - tmp[i], i++);
g[fd] = 1;
for(int i = 0; i <= fd; i++)
tmp2[i] = g[i]; reverse(tmp2, tmp2 + 1 + fd), inv(fd << 1, tmp2, tmp3);
for(int i = 0; i <= fd; i++)
tmp2[i] = 0; while(cnt < (fd << 2))
cnt <<= 1, limit++; for(int i = 0; i < cnt; i++)
rev[i] = (rev[i >> 1] >> 1) | ((i & 1) << limit); NTT(g, cnt, 1), NTT(tmp3, cnt, 1), base[1] = res[0] = 1;
while(exponent) {
if(exponent & 1) {
NTT(res, cnt, 1), NTT(base, cnt, 1);
for(int i = 0; i < cnt; i++)
res[i] = (ll)res[i] * base[i] % MOD;
NTT(res, cnt, -1), NTT(base, cnt, -1), mod(res);
}
NTT(base, cnt, 1);
for(int i = 0; i < cnt; i++)
base[i] = (ll)base[i] * base[i] % MOD;
NTT(base, cnt, -1), mod(base), exponent >>= 1;
}
for(int i = 0; i < fd; i++)
rres = (rres + (ll)res[i] * f[i] % MOD) % MOD;
printf("%d\n", rres);
}

模板 - 线性递推BM的更多相关文章

  1. [模板]线性递推+BM

    暴力版本: #include<bits/stdc++.h> #define mod 998244353 using namespace std; typedef long long int ...

  2. LG5487 【模板】线性递推+BM算法

    [模板]线性递推+BM算法 给出一个数列 \(P\) 从 \(0\) 开始的前 \(n\) 项,求序列 \(P\) 在\(\bmod~998244353\) 下的最短线性递推式,并在 \(\bmod~ ...

  3. 线性递推BM模板

    #include <cstdio> #include<iostream> #include <cstring> #include <cmath> #in ...

  4. Berlekamp Massey算法求线性递推式

    BM算法求求线性递推式   P5487 线性递推+BM算法   待AC.   Poor God Water   // 题目来源:ACM-ICPC 2018 焦作赛区网络预赛 题意   God Wate ...

  5. BM求线性递推模板(杜教版)

    BM求线性递推模板(杜教版) BM求线性递推是最近了解到的一个黑科技 如果一个数列.其能够通过线性递推而来 例如使用矩阵快速幂优化的 DP 大概都可以丢进去 则使用 BM 即可得到任意 N 项的数列元 ...

  6. 【模板】BM + CH(线性递推式的求解,常系数齐次线性递推)

    这里所有的内容都将有关于一个线性递推: $f_{n} = \sum\limits_{i = 1}^{k} a_{i} * f_{n - i}$,其中$f_{0}, f_{1}, ... , f_{k ...

  7. HDU - 6172:Array Challenge (BM线性递推)

    题意:给出,三个函数,h,b,a,然后T次询问,每次给出n,求sqrt(an); 思路:不会推,但是感觉a应该是线性的,这个时候我们就可以用BM线性递推,自己求出前几项,然后放到模板里,就可以求了. ...

  8. 2018 焦作网络赛 L Poor God Water ( AC自动机构造矩阵、BM求线性递推、手动构造矩阵、矩阵快速幂 )

    题目链接 题意 : 实际上可以转化一下题意 要求求出用三个不同元素的字符集例如 { 'A' .'B' .'C' } 构造出长度为 n 且不包含 AAA.BBB CCC.ACB BCA.CAC CBC ...

  9. 牛客多校第九场 A The power of Fibonacci 杜教bm解线性递推

    题意:计算斐波那契数列前n项和的m次方模1e9 题解: $F[i] – F[i-1] – F[i-2] = 0$ $F[i]^2 – 2 F[i-1]^2 – 2 F[i-2]^2 + F[i-3] ...

随机推荐

  1. 【SaltStack官方版】—— EVENTS & REACTOR指南

    EVENTS & REACTOR Event System Event Bus Event types Salt Master Events Authentication events Sta ...

  2. 一篇文章带你了解JavaScript中的语法,数据类型,流程控制语句以及函数

    作者 | Jeskson 来源 | 达达前端小酒馆 1 JavaScript有多重要啊,才能让我说说一下,其中的语法,操作符,数据类型,内置功能等. 语法: 在JavaScript中的变量,函数名和操 ...

  3. linux运维、架构之路-MySQL(二)

    一.SQL语句实战 1.DDL语句——库管理 ①查看数据库 show databases; show databases like 'word%';#模糊查询数据库 ②创建数据库 create dat ...

  4. Nginx动静分离-tomcat

    一.动静分离 1.通过中间件将动态请求和静态请求分离. 2.为什么? 分离资源,减少不必要的请求消耗,减少请求延时. 3.场景 还可以利用php,fastcgi,python 等方式 处理动态请求 # ...

  5. 进程(process)和线程(thread)

    1.计算机的核心是CPU,它承担了所有的计算任务.它就像一座工厂,时刻在运行. 2.假定工厂的电力有限,一次只能供给一个车间使用.也就是说,一个车间开工的时候,其他车间都必须停工.背后的含义就是,单个 ...

  6. MVP 实战

    那么我们下面就要将这个类中的代码改写为 MVP 的写法,回顾上面提及的 MVP 架构的思想,它是将 View 层与 Model 层彻底隔离,意味着 View 和 Model 都不再持对方的引用,它们通 ...

  7. 麦子lavarel---10、一些第三方应用注意

    麦子lavarel---10.一些第三方应用注意 一.总结 一句话总结: 其实把重要的几个功能弄一个就好了,邮箱验证,手机号验证,支付验证,都是调用第三方接口,也很简单 1.关于页面和服务端校验的看法 ...

  8. pl/sql的安装使用详解

    一.  先安装  orcale10.1客户端 setup右键属性,按下图设置 net  manager 设置,不设置 pl/sql developer没办法连接 二.再安装 pl/sql develo ...

  9. 线性回归 r python 比较

    w http://blog.sina.cn/dpool/blog/s/blog_70f632090101bp8u.html

  10. AtomicReference 源码分析

    AtomicReference AtomicReference 能解决什么问题?什么时候使用 AtomicReference? 1)AtomicReference 可以原子更新引用对象. 2)comp ...