[学习笔记]矩阵乘法及其优化dp

1.定义: $c[i][j]=\sum a[i][k]\times b[k][j]$ 所以矩阵乘法有条件,(n*m)*(m*p)=n*p 即第一个矩阵的列数等于第二个矩阵的行数,否则没有意义. 2.结合律与分配率矩阵乘法不一定任何时候都有交换律.因为交换后甚至不能保证第一个矩阵的列数等于第二个矩阵的行数. 但是,矩阵乘法有结合律. A*B*C=A*(B*C) 这是一个最常用的运算律,使之可以用矩阵快速幂. 3.构造技巧. 矩阵乘法主要用途还是矩阵加速dp. 例如什么n=1e9之类的. 关键还是…

【学习笔记】动态规划—斜率优化DP（超详细）

[学习笔记]动态规划-斜率优化DP(超详细) [前言] 第一次写这么长的文章. 写完后感觉对斜优的理解又加深了一些. 斜优通常与决策单调性同时出现.可以说决策单调性是斜率优化的前提. 斜率优化 $DP$,顾名思义就是利用斜率相关性质对 $DP$ 进行优化. 斜率优化通常可以由两种方式来理解,需要灵活地运用数学上的数形结合,线性规划思想. 对于这样形式的 $dp$ 方程:$dp[i]=Min/Max(a[i]∗b[j]+c[j]+d[i])$,其中 $b$ 严格单调递增. 该方…

「学习笔记」单调队列优化dp

目录算法例题最大子段和题意思路代码修剪草坪题意思路代码瑰丽华尔兹题意思路代码股票交易题意思路代码算法使用单调队列优化dp 废话对与一些dp的转移方程,我们可以通过拆使它与某个区间的最值相关. 这时可以用单调队列算出区间最值,进行优化. 例题最大子段和题意给出一个长度为 $n$ 的整数序列,从中找出一段长度不超过 $m$ 的连续子序列,使得整个序列的和最大. 思路设 $sum_i$ 为 $i$ 的前缀和,易得答案为: \[\max_…

学习笔记：四边形不等式优化 DP

定义 & 等价形式四边形不等式是定义在整数集上的二元函数 $w(x, y)$. 定义:对于任意 $a \le b \le c \le d$,满足交叉小于等于包含(即 $w(a, c) + w(b, d) \le w(b, c) + w(a, d)$.① 等价形式,对于任意的 $a < b$,都有 $w(a, b-1) + w(a+1,b) \le w(a+1, b-1)+w(a,b)$.② ① 推 ② 看定义即可,② 推 ① 的证明: 任取 $a < d$,\…

「学习笔记」FFT 之优化——NTT

目录「学习笔记」FFT 之优化--NTT 前言引入快速数论变换--NTT 一些引申问题及解决方法三模数 NTT 拆系数 FFT (MTT) 「学习笔记」FFT 之优化--NTT 前言 $NTT$ 在某种意义上说,应该属于 $FFT$ 的一种优化. --因而必备知识肯定要有 $FFT$ 啦... 如果不知道 $FFT$ 的大佬可以走这里引入在 $FFT$ 中,为了能计算单位原根 $\omega$ ,我们使用了 $\text{C++}$ 的 math 库中的…

2018.10.23 bzoj1297: [SCOI2009]迷路（矩阵快速幂优化dp）

传送门矩阵快速幂优化dp简单题. 考虑状态转移方程: f[time][u]=∑f[time−1][v]f[time][u]=\sum f[time-1][v]f[time][u]=∑f[time−1][v] 把一个点拆成9个来转换边长,然后根据题意模拟连边就行了. 最后用矩阵快速幂优化一下转移就能过啦. 代码: #include<bits/stdc++.h> using namespace std; int n,t,m; char s[50]; const int mod=2009; str…

LibreOJ #2325. 「清华集训 2017」小Y和恐怖的奴隶主（矩阵快速幂优化DP）

哇这题剧毒,卡了好久常数才过T_T 设$f(i,s)$为到第$i$轮攻击,怪物状态为$s$时对boss的期望伤害,$sum$为状态$s$所表示的怪物个数,得到朴素的DP方程$f(i,s)=\sum \frac{1}{sum+1}*(f(i+1,s')+[s==s'])$ 状态数只有$C_{8+3}^3=165$个,所以就可以矩乘优化了.再加上一个用于转移的$1$,矩阵大小是$166*166$的,因为多组询问,所以可以先把$2$的所有次幂的矩阵都预处理出来. 然后会发现复杂度是$O(T*166^3…

CUDA 矩阵乘法终极优化指南

作者:马骏 | 旷视 MegEngine 架构师前言单精度矩阵乘法(SGEMM)几乎是每一位学习 CUDA 的同学绕不开的案例,这个经典的计算密集型案例可以很好地展示 GPU 编程中常用的优化技巧,而能否写出高效率的 SGEMM Kernel,也是反映一位 CUDA 程序员对 GPU 体系结构的理解程度的优秀考题.本文将详细介绍 CUDA SGEMM 的优化手段,适合认真阅读过 <CUDA C++ Programming Guide>,具备一定 CUDA 编程基础的同学阅读,希望能给追求极…

2018.10.19 NOIP模拟硬币（矩阵快速幂优化dp）

传送门不得不说神仙出题人DZYODZYODZYO出的题是真的妙. f[i][j][k]f[i][j][k]f[i][j][k]表示选的硬币最大面值为iii最小面值不小于jjj,总面值为kkk时的选法总数. 然后有f[i][l][k1+k2]=∑f[i][j][k1]∗f[j][l][k2]f[i][l][k1+k2]=\sum f[i][j][k1]*f[j][l][k2]f[i][l][k1+k2]=∑f[i][j][k1]∗f[j][l][k2] 这不就是矩阵乘法吗? 上快速幂优化就行了.…

蓝桥 ADV-232 算法提高矩阵乘法【区间DP】

算法提高矩阵乘法时间限制:3.0s 内存限制:256.0MB 问题描述有n个矩阵,大小分别为a0*a1, a1*a2, a2*a3, ..., a[n-1]*a[n],现要将它们依次相乘,只能使用结合率,求最少需要多少次运算. 两个大小分别为p*q和q*r的矩阵相乘时的运算次数计为p*q*r. 输入格式输入的第一行包含一个整数n,表示矩阵的个数. 第二行包含n+1个数,表示给定的矩阵. 输出格式输出一个整数,表示最少的运算次数. 样例输入 31 10 5 20 样…

POJ 3213 矩阵乘法（优化）

思路: 1.暴力出奇迹 n=1000 n^3矩阵乘法竟然能卡过...(Tips:不要乱写读入优化,这玩意儿加了超时,不加AC--) 2. 注意题目中的"最多只能有一个地方不一样,," 我就想到了能不能用一行的和来优化一下..一次算一行我们可以手动模拟一下.. 发现了一个规律-- (本人的草稿纸-- 略乱) 我就模拟了一下答案的第一行.. 发现: 先统计一个sumb[i] +=a[i][j](1<=j<=M) 这个是B数组第i行前M个数的和 sumc[i]是C数组第i行的…

省选模拟赛 Problem 3. count (矩阵快速幂优化DP)

Discription DarrellDarrellDarrell 在思考一道计算题. 给你一个尺寸为 1×N1 × N1×N 的长条,你可以在上面切很多刀,要求竖直地切并且且完后每块的长度都是整数. 在这种限制下其实只有 N−1N − 1N−1 个位置可以切. 对于一种切的方案,假如切完后每块的宽度分别是:w1,w2,w3,...,wk(∑wi=N)w_1, w_2, w_3, ..., w_k(\sum w_i = N)w1,w2,w3,...,wk(∑wi=N),那么该种方案对应…

【笔记篇】斜率优化dp（一） HNOI2008玩具装箱

斜率优化dp 本来想直接肝这玩意的结果还是被忽悠着做了两道数论现在整天浑浑噩噩无心学习甚至都不是太想颓废是不是药丸的表现各位要知道我就是故意要打删除线并不是因为排版错乱反正就是一个del标签嘛并不是什么大事的说讲道理这一篇要不是写laTex我就直接用html写了 Emmmm划掉的原因是因为跟正题一点关系都没有啊不让自己写摘要我写第一段凑摘要好咯第一次写花花绿绿的blog感觉还是很新鲜的你看看我到了正文部分还划不划啊(该划的还是划╭(╯^╰)╮) 其实文章里有彩蛋比如这里被你发现了…

2018.10.22 bzoj1009: [HNOI2008]GT考试（kmp+矩阵快速幂优化dp）

传送门 f[i][j]f[i][j]f[i][j]表示从状态"匹配了前i位"转移到"匹配了前j位"的方案数. 这个东西单次是可以通过跳kmp的fail数组得到的. 考虑到每次都是一样的就可以用矩阵快速幂优化一波. 代码: #include<bits/stdc++.h> using namespace std; int n,m,mod,fail[21]; bool vis[21][10]; char s[21]; struct Matrix{ int va…

2018.10.16 uoj#340. 【清华集训2017】小 Y 和恐怖的奴隶主（矩阵快速幂优化dp）

传送门一道不错的矩阵快速幂优化dpdpdp. 设f[i][j][k][l]f[i][j][k][l]f[i][j][k][l]表示前iii轮第iii轮还有jjj个一滴血的,kkk个两滴血的,lll个三滴血的. 显然是可以从f[i−1]f[i-1]f[i−1]转移过来的. 但是仔细一想,这个递推关系在i=1i=1i=1~nnn的时候都是一样的,于是把后面三个状压上矩阵快速幂优化就行了. 直接转是O(T∗size3log)O(T*size^3log)O(T∗size3log)的. 于是可以用倍增的…

【20181019T2】硬币【矩阵快速幂优化DP】

题面 [错解] 哎$N \leq 50$?双向搜索? 切了切-- 等下,好像要求方案数-- 好像搜不了哎他给$V_{i} | V_{i+1}$干嘛? 肯定有用啊为了体现条件的用处,我在搜下一步时把后面的和S除以当前值但还是T了啊写了个$O(NW^{2})$的完全背包水水,瞎搞了个神奇算法,揉在一起,成功爆零 [正解] 设$f_{t,i,j}$表示选的硬币编号最大为i,最小大于等于j的凑出t的方案数这样可以完整地表示出\(f_{t,i,j}=\sum f_{t_{1},i…

【bzoj1009】[HNOI2008]GT考试（矩阵快速幂优化dp+kmp）

题目传送门:https://www.lydsy.com/JudgeOnline/problem.php?id=1009 这道题一看数据范围:$ n<=10^9 $,显然不是数学题就是矩乘快速幂优化dp. 我们设$ f[i][j] $表示前$ i $位匹配不吉利数字$ j $位时的方案数,因为每一位的转移方式都是相同的,于是用kmp预处理出转移矩阵,直接矩乘快速幂就能过了. #include<cstdio> #include<cmath> #include<cstdlib…

TensorFlow 深度学习笔记 TensorFlow实现与优化深度神经网络

转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到Issue区讨论官方教程地址视频/字幕下载全连接神经网络辅助阅读:TensorFlow中文社区教程 - 英文官方教程代码见:full_connect.py Linear Model 加载lesson 1中的数据集将Data降维成一维,将label映射为one-hot encoding def reformat(dataset, labe…

LOJ2325. 「清华集训 2017」小 Y 和恐怖的奴隶主【矩阵快速幂优化DP】【倍增优化】

LINK 思路首先是考虑怎么设计dp的状态发现奴隶主的顺序没有影响,只有生命和个数有影响,所以就可以把每个生命值的奴隶主有多少压缩成状态就可以了然后发现无论是什么时候一个状态到另一个状态的转移都是固定的方式所以可以预处理转移矩阵用矩阵快速幂进行优化但是如果在计算的时候暴力$状态^3$进行转移会TLE 但是注意到在这个时候有用的状态其实只有一个向量所以就预处理倍增然后用向量乘矩阵来优化到单次$logn状态^2$就可以了有点卡常 //Author: dream_maker #i…

【BZOJ4861】[Beijing2017]魔法咒语矩阵乘法+AC自动机+DP

[BZOJ4861][Beijing2017]魔法咒语题意:别看BZ的题面了,去看LOJ的题面吧~ 题解:显然,数据范围明显的分成了两部分:一个是L很小,每个基本词汇长度未知:一个是L很大,每个基本词汇的长度是1或2.看来只能写两份代码了. 对于L很小的,我们先将禁忌串建成一个AC自动机,然后预处理出to[i][j]表示AC自动机中的第i个节点在加入基本词汇j后会到达的节点.然后设f[i][j]表示总长度为i,匹配到第j个节点的方案数.然后DP一下就好了. 对于L很大的,我们想到矩乘,设ans…

bzoj1009 [HNOI2008]GT考试——KMP+矩阵快速幂优化DP

题目:https://www.lydsy.com/JudgeOnline/problem.php?id=1009 字符串计数DP问题啊...连题解都看了好多好久才明白,别提自己想出来的蒟蒻我... 首先要设计一个不太好想的状态:f[i][j]表示大串上到第 i 位时有小串前 j 位的后缀,且不包含整个小串的方案数: 也就是如果小串是 12312 , f[5][3] 表示目前大串的情况是 **123... : 这个状态要从 i 转移到 i+1 ,还需要一个帮助它的数组 a,a[i][j]表示在长度…

CF576D Flights for Regular Customers 矩阵乘法 + Bitset优化

%%%cxhscst2's blog Codeforces 576D Flights for Regular Customers(矩阵加速DP) 代码非常优美 + 简洁,学习到了 Code: #include <bits/stdc++.h> #define N 160 #define inf 0x3f3f3f3f #define maxn 1000000 #define setIO(s) freopen(s".in","r",stdin) using n…

2019.02.11 bzoj4818: [Sdoi2017]序列计数（矩阵快速幂优化dp）

传送门题意简述:问有多少长度为n的序列,序列中的数都是不超过m的正整数,而且这n个数的和是p的倍数,且其中至少有一个数是质数,答案对201704082017040820170408取模(n≤1e9,m≤2e7,p≤100)(n\le1e9,m\le2e7,p\le100)(n≤1e9,m≤2e7,p≤100). 思路: 首先因为只需要是ppp的倍数,因此可以看成全局和对ppp取模为000方案数. 设状态f0/1,i,jf_{0/1,i,j}f0/1,i,j表示不限制选出的数/选出的数不能是质…

Codeforces Round #307 (Div. 2) D. GukiZ and Binary Operations 矩阵快速幂优化dp

D. GukiZ and Binary Operations time limit per test 1 second memory limit per test 256 megabytes input standard input output standard output We all know that GukiZ often plays with arrays. Now he is thinking about this problem: how many arrays a, of l…

【矩阵快速幂优化DP】【校内测试】

实际上是水水题叻,先把朴素DP方程写出来,发现$dp[i]$实际上是$dp[i-k]-dp[i-1]$的和,而看数据范围,我们实际上是要快速地求得这段的和,突然就意识到是矩阵快速幂叻. 构建矩阵什么的还是很简单滴,主要就是练一练手. (还有就是水一水blog!换个字体,换个心情! (快速乘是在模数很大时要用,避免超long long #include<bits/stdc++.h> using namespace std; #define LL long long #define mod 777…

HDU5411——CRB and Puzzle——————【矩阵快速幂优化dp】

CRB and Puzzle Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/65536 K (Java/Others)Total Submission(s): 558 Accepted Submission(s): 227 Problem Description CRB is now playing Jigsaw Puzzle.There are N kinds of pieces with infinite s…

Sam's Numbers 矩阵快速幂优化dp

https://www.hackerrank.com/contests/hourrank-21/challenges/sams-numbers 设dp[s][i]表示产生的总和是s的时候,结尾符是i的所有合法方案数. 那么dp[s][i]可以由dp[s - i][1---m]中,abs(i - k) <= d的递推过来. 但是s很大,不能这样解决. 考虑到m只有10,而且dp[s][1]只能由dp[s - 1][1...m]递推过来. 那么先预处理dp[1--m][1--m] 写成m * m的一…