题面

因为出题人水平很高,所以这场比赛的题水平都很高。

ZZH 喜欢计数。

ZZH 有很多的数,经过统计,ZZH一共有

v

0

v_0

v0​ 个 0 ,

v

1

v_1

v1​ 个 1,…,

v

2

n

1

v_{2^n-1}

v2n−1​ 个

2

n

1

2^n-1

2n−1 。因为一些原因,ZZH 只有这

2

n

2^n

2n 种数。

ZZH 和 GVZ 要对这些数进行 m 次操作。每一次操作由一个人进行。每一次,有

p

p

p 的概率由 ZZH 操作,

1

p

1 - p

1−p 的概率由 GVZ 操作。

两人进行操作的时候都会依次操作每一个数。对于一个数 s ,如果 ZZH 对这个数进行操作,她会在

0

,

1

,

.

.

.

,

2

n

1

0,1,...,2^n-1

0,1,...,2n−1 中找出所有的 t,满足 t or s = s,然后将 s 等概率随机变成找出的 t 中的一个。

如果 GVZ 对这个数进行操作,她会在

0

,

1

,

.

.

.

,

2

n

1

0,1,...,2^n-1

0,1,...,2n−1 中找出所有的 t,满足 t and s = s ,然后将等概率随机变成找出的 t 中的一个。(这里的and/or指二进制与/或操作)

因为操作需要非常长的时间,她们想要知道所有操作结束后,对于每一个 i ,i 的个数的期望。因为期望值可能不是整数,所以她们想知道期望值模

998244353

998244353

998244353 的结果。

因为她们觉得这个问题太简单了,于是她们把这个问题交给了你。

输入格式

第一行四个非负整数

n

,

m

,

a

,

b

n,m,a,b

n,m,a,b ,含义同题目,其中

p

=

a

b

p=\frac{a}{b}

p=ba​。

第二行

2

n

2^n

2n 个正整数,表示

v

0

,

v

1

,

.

.

.

,

v

2

n

1

v_0,v_1,...,v_{2^n-1}

v0​,v1​,...,v2n−1​。

输出格式

输出一行

2

n

2^{n}

2n 个整数,依次表示 0 的个数的期望,1 的个数的期望,…,

2

n

1

2^{n} - 1

2n−1 的个数的期望。

样例

样例输入
2 1 1 3
1 2 3 4
样例输出
665496237 499122178 2 831870299
样例解释

如果 ZZH 进行操作, 0 会随机变为 {0} ,1 会随机变为 {0,1},2 会随机变为 {0,2,} ,3 会随机变为 {0,1,2,3}。

如果 GVZ 进行操作, 0 会随机变为 {0,1,2,3},1 会随机变为 {1,3},2 会随机变为 {2,3} ,3 会随机变为 {3} 。

可以得到期望为

5

3

,

3

2

,

2

,

29

6

\frac{5}{3},\frac{3}{2},2,\frac{29}{6}

35​,23​,2,629​ 。

题解

看到

m

m

m这么大,有手都会想到矩阵快速幂吧。
然后我们想想怎么设计状态。
我们发现,一个数最后变为另一个数的概率只跟里面有多少个1多少个0,以及该数能不能变为那个数有关。

有人想,可以令

d

p

[

i

]

[

j

]

dp[i][j]

dp[i][j] 为原来有

i

i

i 个 1,m 次变化后有

j

j

j 个 1 的概率,
虽然满足第一个限制,即和 1 的数量有关,但是并不一定满足第二个性质,

举个例子:

i
  

:

111110000000000

i\;:111110000000000

i:111110000000000

j

:

000000000001111

j\,:000000000001111

j:000000000001111
如果是上面那样定义的 dp 的话,

i

i

i 是可以一次转移到

j

j

j 的,但是根据题意,这合理吗?这不合理。

那么我们得设计一个 dp,使其能够满足那两个限制。

设计 dp

d

p

[

z

]

[

x

]

[

y

]

dp[z][x][y]

dp[z][x][y] 为原先有

z

z

z 个 1,最后

x

x

x 个原先的 0 变为 1,有

y

y

y 个原先的 1 仍是 1(那么自然地,就有

z

y

z-y

z−y 个原先的 1 变为 0 了,且不难想到初始状态是

d

p

[

z

]

[

0

]

[

z

]

=

1

dp[z][0][z]=1

dp[z][0][z]=1),

所以这个表我必须得贴出来,以免推到后面大家被搞懵了:

x

:

0

1

y

:

1

1

z

y

:

1

0

n

z

x

:

0

0

\begin{matrix} x&:0\rightarrow 1\\ y&:1\rightarrow 1\\ z-y&:1\rightarrow 0\\ n-z-x&:0\rightarrow 0\end{matrix}

xyz−yn−z−x​:0→1:1→1:1→0:0→0​

好了,定义了 dp 以后,我们再想一想它的转移方程,
根据题意,对于

(

t
  

&
  

s

=

=

s

)
  


  

(

t
  


  

s

=

=

s

)

\forall (t\;\&\;s==s)\;\|\;(t\;|\;s==s)

∀(t&s==s)∥(t∣s==s),t 都对 s 的 dp 状态有贡献,所以状态转移如下:

d

p

[

z

]

[

x

]

[

y

]

=

i

=

x

n

z

j

=

y

z

d

p

[

z

]

[

i

]

[

j

]

p

2

i

x

2

j

y

2

x

+

y

C

(

i

,

x

)

C

(

j

,

y

)

+

i

=

0

x

j

=

0

y

d

p

[

z

]

[

i

]

[

j

]

(

1

p

)

2

x

i

2

y

j

2

n

x

y

C

(

n

z

i

,

x

i

)

C

(

z

j

,

y

j

)

\begin{matrix} dp[z][x][y] = \sum_{i=x}^{n-z}\sum_{j=y}^{z}dp[z][i][j]\cdot p\cdot 2^{i-x}\cdot 2^{j-y} \cdot 2^{x+y}\cdot C(i,x) \cdot C(j,y)+\\\sum_{i=0}^{x}\sum_{j=0}^{y}dp[z][i][j]\cdot (1-p)\cdot 2^{x-i}\cdot 2^{y-j} \cdot 2^{n-x-y}\cdot C(n-z-i,x-i) \cdot C(z-j,y-j)\end{matrix}

dp[z][x][y]=∑i=xn−z​∑j=yz​dp[z][i][j]⋅p⋅2i−x⋅2j−y⋅2x+y⋅C(i,x)⋅C(j,y)+∑i=0x​∑j=0y​dp[z][i][j]⋅(1−p)⋅2x−i⋅2y−j⋅2n−x−y⋅C(n−z−i,x−i)⋅C(z−j,y−j)​

然后,是不是就要

n

3

n^3

n3 的状态全部矩阵加速呢?这明显过不了,但是我们会发现

d

p

[

z

]

[

x

]

[

y

]

dp[z][x][y]

dp[z][x][y] 的转移方程里, z 是没有变的,所以,我们可以在外面枚举 z ,在里面把最多

n

2

4

\frac{n^2}{4}

4n2​ 种状态进行矩阵加速(为什么最多这么多种状态呢?因为

x

+

y

<

=

n

x+y<= n

x+y<=n,所以 z 接近

n

2

\frac{n}{2}

2n​ 的时候状态最多),这是可行的。

优化查表

把 dp 处理出来后,我们就处理出了数与数之间转移的概率

但还有个致命的问题,就是计算答案的时候我们还得枚举两个数 i 和 j,然后算上他们的贡献,这是

n

2

n^2

n2 的。

怎么优化呢?
这里的优化是最难讲明白的,我就建个模好了
我们原先实际上是在跑一个图:

边表示一个数对另一个数的贡献,这样的边有

n

2

n^2

n2 条(有些边权可为 0),所以跑得很慢。

怎么办呢?

第一种理解途径:原理—— “优化建图”

这里说得有点玄乎,实际上是多加一些点,少跑一些边

我们发现这些边的贡献有重复(这是肯定的吧),于是就可以想一个法子尽量把重复的贡献连向一个中间的工具点,然后再由工具点连向目标点,

上面那句话有点抽象,但是原理很明白,
举个例子,下面 4+4 个点的完全二分图(有向)的所有边权都一样,令边权为 k:

于是我们可以设置一个中间工具点,所有起点连向它,于是它的点权为 4k ,然后它又连向所有终点,给所有终点贡献 4k,这样可以达到原图效果,但是边数却大大减少:

就是这么个原理,所以我们就把计算贡献的图建成这样:

对于其中一个数 i ,我们要使其一位一位地贡献到各个终点去,这样边才最少

第二种理解途径:记忆化搜索

对于 i、j ,换一种枚举方式,先枚举

d

p

[

z

=

b

i

t

c

o

u

n

t

[

i

]

]

[

x

]

[

y

]

dp[z=bitcount[i]][x][y]

dp[z=bitcount[i]][x][y] ,然后这个

d

p

[

z

]

[

x

]

[

y

]

dp[z][x][y]

dp[z][x][y] 就代表着从 i 转移出去,过程中 x 个0变1,z-y 个1变0的所有 j ,i 对 j 的贡献都为

d

p

[

z

]

[

x

]

[

y

]

dp[z][x][y]

dp[z][x][y];

然后具体有哪些 j 呢?一般的思路是暴力枚,从 i 的第一位开始dfs,枚举这一位要不要变,如果变,0变1的话就消耗了一下 x,1变0就消耗了一下 z-y,如果不变,那就之接到下一位,于是

void dfs(int t,int S,int I,int J) {//枚到哪一位了 , i 变成什么样了 , x还剩多少 , z-y还剩多少
......
}

虽然这样会超时,但是它提供给了我们一个思路,因为它可以记忆化

重头戏:g[t][s][i][j]

我们设一个

g

[

t

]

[

S

]

[

i

]

[

j

]

g[t][S][i][j]

g[t][S][i][j],这是我们定义的,引用一下知名博主的定义(有删改)

这个过程不用建图,设

g

[

t

]

[

s

]

[

i

]

[

j

]

g[t][s][i][j]

g[t][s][i][j] 为操作了

t

t

t 次(是对于每个数位的操作),当前得到的数是

s

s

s,还有

i

i

i 个

0

0

0 要变成

1

1

1,还有

j

j

j 个

1

1

1 要变成

0

0

0,初始化就用上面的方法,转移暴力刷表就行了

附个表:

i

:

0

1

j

:

1

0

\begin{matrix} i&:0\rightarrow 1\\ j&:1\rightarrow 0\\ \end{matrix}

ij​:0→1:1→0​

附上

g

[

t

]

[

s

]

[

i

]

[

j

]

g[t][s][i][j]

g[t][s][i][j] 的转移:

g

[

0

]

[

s

]

[

i

]

[

j

]

=

d

p

[

b

i

t

c

o

u

n

t

(

s

)

]

[

i

]

[

b

i

t

c

o

u

n

t

(

s

)

j

]

v

s

g

[

t

]

[

s

]

[

i

]

[

j

]

=

g

[

t

1

]

[

s

]

[

i

]

[

j

]

+

(

s

[

t

]

=

=

1

?
    

g

[

t

1

]

[

s
  

x

o

r
  

(

1

<

<

t

1

)

]

[

i

+

1

]

[

j

]

:

g

[

t

1

]

[

s
  

x

o

r
  

(

1

<

<

t

1

)

]

[

i

]

[

j

+

1

]

)

\begin{matrix} g[0][s][i][j]=&dp[bitcount(s)][i][bitcount(s)-j]\cdot v_s\\ g[t][s][i][j]=&g[t-1][s][i][j]+\\ &(s[t]==1?\;\;g[t-1][s\;xor\;(1<<t-1)][i+1][j]:\\ &g[t-1][s\;xor\;(1<<t-1)][i][j+1]) \end{matrix}

g[0][s][i][j]=g[t][s][i][j]=​dp[bitcount(s)][i][bitcount(s)−j]⋅vs​g[t−1][s][i][j]+(s[t]==1?g[t−1][sxor(1<<t−1)][i+1][j]:g[t−1][sxor(1<<t−1)][i][j+1])​

什么意思呢,t 是前 t 位的意思,S是处理到半截的残疾状态,下面是随便的一种转移过程:

t=0: S: 01011001…
t=1: S:1 1011001…
t=2: S:11 011001…
t=3: S:110 11001…

这其实就是上面dfs的过程!

g[t][s][i][j] 的计算

那么最后,一个数 j 收到的贡献可以直接输出

g

[

n

]

[

j

]

[

0

]

[

0

]

g[n][j][0][0]

g[n][j][0][0] 了。

但是如果真这样开数组,空间会爆炸,所以我们要把第一维 t 给滚动掉,或者改变枚举顺序把它消掉。

为了卡常数,我们得先枚举 i(↑),j(↑),然后再枚举 s,数组开成

g

[

i

]

[

j

]

[

s

]

g[i][j][s]

g[i][j][s]。

CODE

#include<queue>
#include<vector>
#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
#define MAXN 1000005
#define LL long long
#define DB double
#define ENDL putchar('\n')
#define lowbit(x) ((-x)&(x))
#pragma GCC optimize(2)
LL read() {
LL f = 1,x = 0;char s = getchar();
while(s < '0' || s > '9') {if(s=='-')f = -f;s = getchar();}
while(s >= '0' && s <= '9') {x=x*10+(s-'0');s = getchar();}
return f * x;
}
const int MOD = 998244353;
int qkpow(int a,int b) {
int res = 1;
while(b > 0) {
if(b & 1) res = res *1ll* a % MOD;
a = a *1ll* a % MOD;b >>= 1;
}return res;
}
int n,m,i,j,s,o,k,p,p2;
int a[1<<17|5],dp[20][20][20];
int bt[1<<17|5];
int ct[18][18][1<<17|5],c[20][20],invc[20][20],tx,ty,inv[30],pi2[30];
int I(int x,int y) {return x*(ty+1)+y+1;}
struct mat{
int n,m;
int s[95][95];
mat(){n=m=0;memset(s,0,sizeof(s));}
}A,B,C;
mat operator * (mat a,mat b) {
mat c;c.n=a.n;c.m=b.m;
for(int i = 1;i <= a.n;i ++) {
for(int k = 1;k <= a.m;k ++) {
if(a.s[i][k])
for(int j = 1;j <= b.m;j ++) {
(c.s[i][j] += a.s[i][k] *1ll* b.s[k][j] % MOD) %= MOD;
}
}
}
return c;
}
mat qkpow(mat a,LL b) {
mat res;res.n = res.m = a.n;
for(int i = 1;i <= a.n;i ++) res.s[i][i] = 1;
while(b > 0) {
if(b & 1) res = res * a;
a = a * a; b >>= 1;
}return res;
}
int main() {
// freopen("counting.in","r",stdin);
// freopen("counting.out","w",stdout);
c[0][0] = 1;invc[0][0] = 1;
inv[0] = inv[1] = 1;
for(int i = 1;i <= 18;i ++) {
c[i][0] = c[i][i] = 1;
invc[i][0] = invc[i][i] = 1;
for(int j = 1;j < i;j ++) {
c[i][j] = (c[i-1][j] + c[i-1][j-1]) % MOD;
invc[i][j] = qkpow(c[i][j],MOD-2);
}
if(i-1) inv[i] = (MOD - inv[MOD % i]) *1ll* (MOD/i) % MOD;
}
pi2[18] = qkpow(1<<18,MOD-2);
for(int i = 17;i >= 0;i --) pi2[i] = pi2[i+1] *2ll % MOD;
n = read();m = read();s = read();o = read();
p = s *1ll* qkpow(o,MOD-2) % MOD;
p2 = (1ll+MOD - p) % MOD;
for(int i = 0;i < (1<<n);i ++) {
a[i] = read();
if(i) bt[i] = bt[i-lowbit(i)] + 1;
}
for(int i = 0;i <= n;i ++) {
A=B=mat();
A.n = 1;
tx = n-i,ty = i;
A.m = B.n = B.m = I(tx,ty);
A.s[1][I(0,i)] = 1;
for(int xx = 0;xx <= tx;xx ++) {
for(int yy = 0;yy <= ty;yy ++) {
for(int xp = 0;xp <= xx;xp ++) {
for(int yp = 0;yp <= yy;yp ++) {
(B.s[I(xp,yp)][I(xx,yy)] += p2 *1ll* pi2[xx-xp] % MOD *1ll* pi2[yy-yp] % MOD *1ll* pi2[n-xx-yy] % MOD *1ll* c[n-i-xp][xx-xp] % MOD *1ll* c[i-yp][yy-yp] % MOD) %= MOD;
}
}
for(int xp = xx;xp <= tx;xp ++) {
for(int yp = yy;yp <= ty;yp ++) {
(B.s[I(xp,yp)][I(xx,yy)] += p *1ll* pi2[xp-xx] % MOD *1ll* pi2[yp-yy] % MOD *1ll* pi2[xx+yy] % MOD *1ll* c[xp][xx] % MOD *1ll* c[yp][yy] % MOD) %= MOD;
}
}
}
}
C = A * qkpow(B,m);
for(int xx = 0;xx <= tx;xx ++) {
for(int yy = 0;yy <= ty;yy ++) {
dp[i][xx][yy] = C.s[1][I(xx,yy)] *1ll* invc[i][yy] % MOD *1ll* invc[n-i][xx] % MOD;
}
}
}
for(int i = 0;i < (1<<n);i ++) {
int zz = bt[i];
for(int xx = 0;xx <= (n-zz);xx ++) {
for(int yy = 0;yy <= zz;yy ++) {
ct[xx][zz-yy][i] = dp[zz][xx][yy] *1ll* a[i] % MOD;//ct其实就是g
}
}
}
for(int t = 0;t < n;t ++) {
for(int xx = 0;xx <= n;xx ++) {
for(int yy = 0;yy <= n-xx;yy ++) {
for(int S = 0;S < (1<<n);S ++) {
if(!(S & (1<<t))) {
if(xx > 0) (ct[xx-1][yy][S ^ (1<<t)] += ct[xx][yy][S]) %= MOD;
}
if(S & (1<<t)) {
if(yy > 0) (ct[xx][yy-1][S ^ (1<<t)] += ct[xx][yy][S]) %= MOD;
}
}
}
}
}
for(int i = 0;i < (1<<n);i ++) {
printf("%d ",ct[0][0][i]);
}
return 0;
}

ZZH与计数(矩阵加速,动态规划,记忆化搜索)的更多相关文章

  1. sicily 1176. Two Ends (Top-down 动态规划+记忆化搜索 v.s. Bottom-up 动态规划)

    Description In the two-player game "Two Ends", an even number of cards is laid out in a ro ...

  2. Codevs_1017_乘积最大_(划分型动态规划/记忆化搜索)

    描述 http://codevs.cn/problem/1017/ 给出一个n位数,在数字中间添加k个乘号,使得最终的乘积最大. 1017 乘积最大 2000年NOIP全国联赛普及组NOIP全国联赛提 ...

  3. Poj-P1088题解【动态规划/记忆化搜索】

    本文为原创,转载请注明:http://www.cnblogs.com/kylewilson/ 题目出处: http://poj.org/problem?id=1088 题目描述: 区域由一个二维数组给 ...

  4. UVA_437_The_Tower_of_the_Babylon_(DAG上动态规划/记忆化搜索)

    描述 https://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&page=show_problem&a ...

  5. 滑雪---poj1088(动态规划+记忆化搜索)

    题目链接:http://poj.org/problem?id=1088 有两种方法 一是按数值大小进行排序,然后按从小到大进行dp即可: #include <iostream> #incl ...

  6. [NOIP2017] 逛公园 (最短路,动态规划&记忆化搜索)

    题目链接 Solution 我只会60分暴力... 正解是 DP. 状态定义: \(f[i][j]\) 代表 \(1\) 到 \(i\) 比最短路长 \(j\) 的方案数. 那么很显然最后答案也就是 ...

  7. 【BZOJ1048】分割矩阵(记忆化搜索,动态规划)

    [BZOJ1048]分割矩阵(记忆化搜索,动态规划) 题面 BZOJ 洛谷 题解 一个很简单的\(dp\),写成记忆化搜索的形式的挺不错的. #include<iostream> #inc ...

  8. 专题1:记忆化搜索/DAG问题/基础动态规划

      A OpenJ_Bailian 1088 滑雪     B OpenJ_Bailian 1579 Function Run Fun     C HDU 1078 FatMouse and Chee ...

  9. [BZOJ 1048] [HAOI2007] 分割矩阵 【记忆化搜索】

    题目链接:BZOJ - 1048 题目分析 感觉这种分割矩阵之类的题目很多都是这样子的. 方差中用到的平均数是可以直接算出来的,然后记忆化搜索 Solve(x, xx, y, yy, k) 表示横坐标 ...

随机推荐

  1. 第6章 字符串(上)——C风格字符串

    6.1 C-strings(C 风格字符串) C风格字符串: 字符数组是元素为字符型的数组,字符串是以空字符'\0' 作为数组最后一个元素的字符数组. 如果指定了数组的大小,而字符串的长度又小于数组大 ...

  2. vue 使用npm install安装依赖失败 【问题分析与解决】

    1 进入项目根目录,先通过 npm install 命令安装项目所需依赖,再通过 vue ui 命令打开 Vue Cli 提供的图形化界面,选择项目所在文件夹将项目导入. 出现问题 npm insta ...

  3. JS:eval

    定义和用法: eval() 函数计算 JavaScript 字符串,并把它作为脚本代码来执行.eval()函数并不会创建一个新的作用域,并且它的作用域就是它所在的作用域. 如果参数是一个表达式,eva ...

  4. 入门Python数据分析最好的实战项目(一)分析篇

    数据初探 首先导入要使用的科学计算包numpy,pandas,可视化matplotlib,seaborn,以及机器学习包sklearn. python学习交流群:660193417### import ...

  5. Python程序入口 __name__ == ‘__main__‘ 有重要功能(多线程)而非编程习惯

    文章来源于互联网(https://jq.qq.com/?_wv=1027&k=rX9CWKg4) 在Python中,被称为「程序的入口」的 if name =='main': 总是出现在各种示 ...

  6. svn提交报错Unexpected HTTP status 413 'Request Entity Too Large' on

    问题原因:nginx的client_max_body_size设置过小,默认 1M,如果请求的正文数据大于client_max_body_size,HTTP协议会报错 413 Request Enti ...

  7. arcgis中栅格矢量计算技巧收藏

    ​ ​编辑 一.计算面积 ( 可以帮我们计算小班面积 )添加 AREA 字段,然后右键点击字段列,然后点击 CALCULATE VALUES; ---> 选择 ADVANCED -->把下 ...

  8. Thread类的常用方法_获取线程名称的方法和设置线程名称的方法

    Thread类的常用方法 获取线程的名称: 1.使用Thread类中的方法getName() String getName() 返回该线程的名称 2.可以先获取到当前正在执行的线程,使用线程中的方法g ...

  9. nginx编译安装支持lua脚本

    一.准备编译环境 1.操作系统:CentOS7.6 2.安装编译所需安装包 yum install gcc pcre pcre-devel zlib zlib-devel openssl openss ...

  10. DTS搭载全新自研内核,突破两地三中心架构的关键技术|腾讯云数据库

    随着企业规模的扩大,对数据库可用性要求越来越高,更多企业采用两地三中心.异地多活的架构,以提高数据库的异常事件应对能力. 在数据库领域,我们常听的"两地三中心"."异地多 ...