题面



$ solution: $

首先,如果题目只要我们求 $ A^K $ 那这一题我们可以直接模版矩乘快速幂来做,但是它现在让我们求 $ \sum_{i=1}{k}{(Ai)} $ 所以我们思考一下这两者是否有什么关系。仔细一想,不难发现几个东西:

  1. 一次矩阵乘法复杂度为 $ O(n^3) $ ,所以我们不能进行太多次矩阵乘法
  2. 快速幂的复杂度为 $ O(logk) $ 再乘一下矩阵乘法的复杂度,我们现在只能再接受 $ O(log) $ 级别的处理了
  3. 矩阵乘法满足交换律和结合律!!!!
  4. 若我们已经知道了 $ A1+A2+A3+A4 $ 的值,我们 需要 $ A5+A6+A7+A8 $ 的值,我们可以直接将前者乘上一个 $ A^4 $ 就可以了!

根据以上发现,我们不妨再设一个矩阵B,来帮助我们理解!

我们设 $ B_x=A1+A2+.....+A^x $ 根据上面第四个的原理我们可以得到:

  1. $ B_1=A^1 $
  2. $ B_2=A1+A1\times A^1=B_1+B_1\times A^1 $
  3. $ B_4=(A1+A2)+A^2\times (A1+A2)=B_2+A^2\times B_2 $
  4. $ B_8=(A1+A2+A3+A4)+A^4\times (A1+A2+A3+A4)=B_4+A^4\times B_4 $
  5. $ B_{16}=B_8+A^8\times B_8 $
  6. $ B_{2\times x}==B_x+A_x\times B_x $
  7. 在根据上面第四个规律可以得出: $ B_{x\times y}==B_x+A_x\times B_y $

而我们要得到的最终结果就是 $ B_K $ 嘛。如果上述的B矩阵的底数能相加,那我们不就可以仿照二进制来得到 $ B_K $ 了吗?就像K等于19,如果我们可以直接 $ B_{19}=B_{1+2+16}=B_1+B_2+B_{16} $ (假设!)那我们就能log预处理所有 $ B_{1<<i} $ 然后log求出 $ B_K $ 了!

我们再思考一下,发现上述 $ B $ 矩阵的底数是可以相加的,但是不像上面那个式子那么直接相加,我们应该这么求: $ B_{x+y}=B_x+A^x\times B_y $ 这样底数就可以相加了!!!

然后我们再仿照二进制,就能log求出 $ B_K $ 了!



$ code: $

#include<iostream>
#include<cstdio>
#include<iomanip>
#include<algorithm>
#include<cstring>
#include<cstdlib>
#include<ctime>
#include<cmath>
#include<vector>
#include<queue>
#include<map>
#include<set> #define ll long long
#define db double
#define inf 0x7fffffff
#define rg register int using namespace std; int n,m,k; inline int qr(){ char ch;//快读
while((ch=getchar())<'0'||ch>'9');
int res=ch^48;
while((ch=getchar())>='0'&&ch<='9')
res=res*10+(ch^48);
return res;
} struct su{
int s[30][30];
inline void read(){//读入一个矩阵
for(rg i=0;i<n;++i)
for(rg j=0;j<n;++j)
s[i][j]=qr();
}
inline void write(){//输出一个矩阵
for(rg i=0;i<n;++i){
for(rg j=0;j<n;++j)
printf("%d ",s[i][j]);
puts("");
}
}
inline su operator *(su x){//矩阵乘法
su y; memset(y.s,0,sizeof(y.s));
for(rg i=0;i<n;++i)
for(rg j=0;j<n;++j)
for(rg o=0;o<n;++o)
y.s[i][j]+=(ll)s[i][o]*x.s[o][j]%m,y.s[i][j]%=m;
return y;
}
inline su operator +(su x){//矩阵加法
for(rg i=0;i<n;++i)
for(rg j=0;j<n;++j)
x.s[i][j]+=s[i][j],x.s[i][j]%=m;
return x;
}
}ans,a[33],b[33]; int main(){
//freopen("t1.in","r",stdin);
//freopen("t1.out","w",stdout);
n=qr();k=qr();m=qr();
a[1].read(); b[1]=a[1];
for(rg i=1;i<32;++i){//我们求出对应所有的a与b
a[i+1]=a[i]*a[i]; //a数组表示A[1<<i-1]
b[i+1]=b[i]*a[i]+b[i]; //b数组表示b[1<<i-1]
}
for(rg i=1;i<=32;++i){//根据二进制,不断累加,一直到b[k]
if(k&1)ans=ans*a[i]+b[i]; //ans相当于b[ans]
k>>=1; //k&1表示这一位上是一,不懂可以先学下快速幂的原理
} ans.write();//累加完毕输出
return 0;
}

我们发现上面main函数中的两个for循环可以换成一个,于是:

int main(){
n=qr();k=qr();m=qr(); a.read(); b=a;
while(k){
if(k&1)ans=ans*a+b;
b=b*a+b; a=a*a; k>>=1;
} ans.write(); //不仅代码短,跑的还十分快!!!!!
return 0;
}

POJ3233 Matrix Power Series(快速幂求等比矩阵和)的更多相关文章

  1. POJ 3233 Matrix Power Series——快速幂&&等比&&分治

    题目 给定一个 $n \times n$  的矩阵 $A$ 和正整数 $k$ 和 $m$.求矩阵 $A$ 的幂的和. $$S = A + A^2 + ... + A^k$$ 输出 $S$ 的各个元素对 ...

  2. [POJ3233]Matrix Power Series 分治+矩阵

    本文为博主原创文章,欢迎转载,请注明出处 www.cnblogs.com/yangyaojia [POJ3233]Matrix Power Series 分治+矩阵 题目大意 A为n×n(n<= ...

  3. POJ3233:Matrix Power Series(矩阵快速幂+二分)

    http://poj.org/problem?id=3233 题目大意:给定矩阵A,求A + A^2 + A^3 + … + A^k的结果(两个矩阵相加就是对应位置分别相加).输出的数据mod m.k ...

  4. POJ3233 Matrix Power Series 矩阵快速幂 矩阵中的矩阵

    Matrix Power Series Time Limit: 3000MS   Memory Limit: 131072K Total Submissions: 27277   Accepted:  ...

  5. POJ3233]Matrix Power Series && [HDU1588]Gauss Fibonacci

    题目:Matrix Power Series 传送门:http://poj.org/problem?id=3233 分析: 方法一:引用Matrix67大佬的矩阵十题:这道题两次二分,相当经典.首先我 ...

  6. poj3233 Matrix Power Series(矩阵快速幂)

    题目要求的是 A+A2+...+Ak,而不是单个矩阵的幂. 那么可以构造一个分块的辅助矩阵 S,其中 A 为原矩阵,E 为单位矩阵,O 为0矩阵    将 S 取幂,会发现一个特性: Sk +1右上角 ...

  7. POJ3233 Matrix Power Series

    Description Given a n × n matrix A and a positive integer k, find the sum S = A + A2 + A3 + … + Ak. ...

  8. poj3233—Matrix Power Series

    题目链接:http://poj.org/problem?id=3233 题目意思:给一个矩阵n*n的矩阵A和一个k,求一个式子 S = A + A2 + A3 + … + Ak. 这个需要用到等比数列 ...

  9. POJ-3233 Matrix Power Series 矩阵A^1+A^2+A^3...求和转化

    S(k)=A^1+A^2...+A^k. 保利求解就超时了,我们考虑一下当k为偶数的情况,A^1+A^2+A^3+A^4...+A^k,取其中前一半A^1+A^2...A^k/2,后一半提取公共矩阵A ...

随机推荐

  1. bram和dram的区别

    http://blog.csdn.net/jbb0523/article/details/6533760

  2. appium使用错误集合

    原因:没有加载该文件 解决方案: cmd 使用:adb shell uiautomator dump 在cmd生成   然后就可以获取元素了 使用send_keys()输入报错  selenium.c ...

  3. tensorflow_mmp

    搭建win10+py3.6+cuda9.1+cudnn7+tf1.5(如果想知道为什么这么搭配,自己去装两天就知道了) tensorflow_gpu......whl下载 剩下的官网下载,cuda9. ...

  4. 数据挖掘(二)用python实现数据探索:汇总统计和可视化

    今天我们来讲一讲有关数据探索的问题.其实这个概念还蛮容易理解的,就是我们刚拿到数据之后对数据进行的一个探索的过程,旨在了解数据的属性与分布,发现数据一些明显的规律,这样的话一方面有助于我们进行数据预处 ...

  5. Python的单向链表实现

    思路 链表由节点组成,先规定节点(Node),包含data和指向下个节点的next 初始化 data当然就是传入的data了,next指向None 添加 分两种情况: 链表为空,那么头节点和尾节点都指 ...

  6. 自学Linux Shell16.1-函数概念

    点击返回 自学Linux命令行与Shell脚本之路 16.1-函数概念 编写比较复杂的shell脚本时,完成具体任务的代码可能需要重复使用.bash shell提供满足这种要求的特性.函数是被赋予名称 ...

  7. 【CF715E】Complete the Permutations(容斥,第一类斯特林数)

    [CF715E]Complete the Permutations(容斥,第一类斯特林数) 题面 CF 洛谷 给定两个排列\(p,q\),但是其中有些位置未知,用\(0\)表示. 现在让你补全两个排列 ...

  8. 平衡树Splay

    维护区间添加,删除,前驱,后继,排名,逆排名 普通平衡树 #include <cstdio> #define ls t[now].ch[0] #define rs t[now].ch[1] ...

  9. 【BZOJ1558】等差数列(线段树)

    [BZOJ1558]等差数列(线段树) 题面 BZOJ 题解 可以说这道题已经非常毒瘤了 怎么考虑询问操作? 如果直接将一段数分解为等差数列? 太麻烦了.... 考虑相邻的数做差, 这样等差数列变为了 ...

  10. docker的memory和cpu资源限制

    这里仅针对docker本身,不涉及任何编排工具compose或者k8s等. 按照惯例,官文撸起来. 重要的部分是一些选项,用来限制资源大小. Memory Most of these options ...