期望概率DP

期望

$x$ 的期望 $E(x)$ 表示平均情况下 $x$ 的值。

令 $C$ 表示常数， $X$ 和 $Y$ 表示两个随机变量。

$E(C)=C$
$E(C \times X)=C \times E(X)$
$E(X+Y)=E(X)+E(Y)$ 期望的线性性
$E(XY)$ 不一定等于 $E(X) \times E(Y)$

期望练习：

题意：

$n$ 个格子从左往右排成一排，$m$ 次操作。

每次操作随机选择一个区间 $[l,r]$ ，将里面所有格子涂黑。

求 $m$ 次操作完毕后，被涂黑的格子数量的期望。

$solution$：

期望的线性性，答案等于每个格子被涂黑的概率之和。

对于某个格子，假设一次操作涂黑它的概率为 $p$ ，则 $m$ 次操作涂黑它的概率为 $1-(1-p)^m$。

期望（概率）DP

游走I

题意：

$n$ 个点 $m$ 条边的有向无环图，保证 $1$ 可以到达每个点，且每个点可以到达 $n$ 号点。如果现在在 $x$ ，$x$ 连了 $d$ 条边出去，那么会以 $\dfrac{1}{d}$ 的概率随机选择一条边走过去。

求 $1$ 游走到 $n$ 的期望步数。

$n \le 100000 $ ，$m \le 200000$

$solution$ ：

记忆化搜索。

设 $e[x]$ 表示 $x$ 走到 $n$ 的期望步数。

\[e[n]=0
\]

\[e[x]= 1 + \dfrac{\sum_{y}^{y \in son[x]}e[y]}{d[x]}
\]

复杂度：$O(n + m)$ 。

$\texttt{code}$

void dfs(ll x)
{
	 if(dp[x]!=-1) return;
	 ll cnt=0;
	 for(ll i=hea[x];i;i=nex[i])
	 {
	 	 dfs(ver[i]);
	 	 cnt+=dp[ver[i]];
	 }
	 dp[x]=(cnt*inv[x]+1)%mod;
}
for(ll i=1;i<=m;i++)
{
	 u=rd(),v=rd();
	 add(u,v),outd[u]+=1;
}
for(ll i=1;i<=n;i++) inv[i]=Pow(outd[i],mod-2);
dfs(1);
printf("%lld\n",dp[1]);

游走II

题意：

$n$ 个点 $m$ 条边的有向无环图，保证 $1$ 可以到达每个点，且每个点可以到达 $n$ 号点。如果现在在 $x$ ，$x$ 连了 $d$ 条边出去，那么会以 $\dfrac{1}{d+1}$ 的概率随机选择一条边走过去，或者以 $\dfrac{1}{d+1}$ 的概率待在 $x$ 点不动。

求 $1$ 游走到 $n$ 的期望步数。

$n \le 100000$ ，$m \le 200000$

$solution$ ：

\[e[x]=\dfrac{e[x]+\sum_{y}^{y \in son[x]}{e[y]}}{d[x]+1}+1
\]

有 $e[x]$ 怎么办？化简！

\[e[x] \times (d[x]+1)=e[x]+d[x]+1+\sum_{y}^{y \in son[x]}{e[y]}
\]

\[e[x] \times d[x]=d[x]+1+\sum_{y}^{y \in son[x]}{e[y]}
\]

结论：

\[e[x]=\dfrac{d[x]+1+\sum_{y}^{y \in son[x]}{e[y]}}{d[x]}
\]

复杂度：$O(n+m)$ 。

$\texttt{code}$

void dfs(ll x)
{
	 if(dp[x]!=-1) return;
	 ll cnt=0;
	 for(ll i=hea[x];i;i=nex[i])
	 {
	 	 dfs(ver[i]);
	 	 cnt+=dp[ver[i]];
	 }
	 dp[x]=(cnt+outd[x]+1)*inv[x]%mod;
}
for(ll i=1;i<=m;i++)
{
	 u=rd(),v=rd();
	 add(u,v),outd[u]+=1;
}
for(ll i=1;i<=n;i++) inv[i]=Pow(outd[i],mod-2);
dfs(1);
printf("%lld\n",dp[1]);

游走III

题意：

$n$ 个点 $m$ 条边的有向无环图，保证 $1$ 可以到达每个点，且每个点可以到达 $n$ 号点。如果现在在 $x$ ，$x$ 连了 $d$ 条边出去，那么会以 $\dfrac{1}{d+1}$ 的概率随机选择一条边走过去，或者以 $\dfrac{1}{d+1}$ 的概率回到 $1$ 号点。

求 $1$ 游走到 $n$ 的期望步数。

$n \le 100000$ ，$m \le 200000$

$solution$ ：

\[e[x]=\dfrac{e[1]+\sum_{y}^{y \in son[x]}{e[y]}}{d[x]+1}+1
\]

有 $e[1]$ 怎么办？另外定义转移方程！

设：

\[e[x]=f[x] * e[1]+g[x]
\]

则有：

\[e[1]=\dfrac{g[x]}{1-f[x]}
\]

带入转移方程式：

\[e[x]=\dfrac{e[1]+\sum_{y}^{y \in son[x]}{e[y]}}{d[x]+1}+1
\]

\[e[x] = \dfrac{e[1]+\sum_{y}^{y \in son[x]}{(f[y] \times e[1] + g[y])}}{d[x]+1}+1
\]

\[e[x] = \begin{pmatrix}\dfrac{e[1]+\sum_{y}^{y \in son[x]}{f[y] \times e[1]}}{d[x]+1}\end{pmatrix} + \begin{pmatrix}1+\dfrac{\sum_{y}^{y \in son[x]}{g[y]}}{d[x]+1}\end{pmatrix}
\]

\[e[x] = \begin{pmatrix}\dfrac{1+\sum_{y}^{y \in son[x]}{f[y]}}{d[x]+1}\end{pmatrix} \times e[1] + \begin{pmatrix}1 + \dfrac{\sum_{y}^{y \in son[x]}{g[y]}}{d[x]+1} \end{pmatrix}
\]

因为 $e[x]=f[x] * e[1]+g[x]$ ，所以最终可以得出结论：

\[f[x] = \dfrac{1+\sum_{y}^{y \in son[x]}{f[y]}}{d[x]+1}
\]

\[g[x] = 1 + \dfrac{\sum_{y}^{y \in son[x]}{g[y]}}{d[x]+1}
\]

\[e[1]=\dfrac{g[x]}{1-f[x]}
\]

带入求值即可。

$\texttt{code}$

void dfs(ll x)
{
	 if(f[x]!=-1) return;
	 ll cntf=0,cntg=0;
	 for(ll i=hea[x];i;i=nex[i])
	 {
	 	 dfs(ver[i]);
	 	 cntf+=f[ver[i]];
	 	 cntg+=g[ver[i]];
	 }
	 f[x]=(cntf+1)*inv[x]%mod;
	 g[x]=(cntg*inv[x]%mod+1ll)%mod;
}
for(ll i=1;i<=m;i++)
{
	 u=rd(),v=rd();
	 add(u,v),outd[u]+=1;
}
for(ll i=1;i<=n;i++) inv[i]=Pow(outd[i]+1,mod-2);
dfs(1);
printf("%lld\n",g[1]*Pow(((1-f[1]+mod)%mod+mod)%mod,mod-2)%mod);

其他习题

P1850 换教室

状态：设 $dp[i][j][0/1]$ 来表示当前为第 $i$ 个阶段，连同这一次已经用了 $j$ 次换教室的机会，当前这次换 $(1)$ 不换 $(0)$ 的最小期望路程总和。

转移：

转移 $dp[i][j][0]$ ：

dp[i][j][0]=fmin
(
	 dp[i-1][j][0] + dis[c[i-1]][c[i]],
	 dp[i-1][j][1] + p[i-1]*dis[d[i-1]][c[i]] + (1.0-p[i-1])*dis[c[i-1]][c[i]]
);

转移 $dp[i][j][1]$ ：

dp[i][j][1]=fmin
(
	 dp[i-1][j-1][0] + p[i]*dis[c[i-1]][d[i]] + (1-p[i])*dis[c[i-1]][c[i]],
	 dp[i-1][j-1][1] +
	 p[i-1]*p[i]*dis[d[i-1]][d[i]] + p[i-1]*(1-p[i])*dis[d[i-1]][c[i]] +
	 (1-p[i-1])*p[i]*dis[c[i-1]][d[i]] + (1-p[i-1])*(1-p[i])*dis[c[i-1]][c[i]]
);

难点：因为在上一次换教室时是概率交换，所以不一定会换，所以要把两种情况的都加上（上面写了）。

$\texttt{code}$

memset(dis,inf,sizeof(dis));
for(int i=1;i<=v;i++) dis[i][i]=0;
int x,y,eg;
for(int i=1;i<=e;i++) x=rd(),y=rd(),eg=rd(),dis[x][y]=dis[y][x]=min(dis[x][y],eg);
for(int k=1;k<=v;k++) for(int i=1;i<=v;i++) for(int j=1;j<=v;j++)
 	 dis[i][j]=dis[j][i]=min(dis[i][j],dis[i][k]+dis[k][j]);
for(int i=1;i<=n;i++) for(int j=0;j<=m;j++) for(int k=0;k<=1;k++) dp[i][j][k]=1.0*inf;
dp[1][0][0]=dp[1][1][1]=0;
for(int i=2;i<=n;i++)
{
	 for(int j=0;j<=min(i,m);j++)
	 {
	 	 dp[i][j][0]=fmin
		 (
		 	 dp[i-1][j][0] + dis[c[i-1]][c[i]],
			 dp[i-1][j][1] + p[i-1]*dis[d[i-1]][c[i]] + (1.0-p[i-1])*dis[c[i-1]][c[i]]
		 );
	 	 if(j!=0) dp[i][j][1]=fmin
		 (
			 dp[i-1][j-1][0] + p[i]*dis[c[i-1]][d[i]] + (1-p[i])*dis[c[i-1]][c[i]],
			 dp[i-1][j-1][1] +
			 p[i-1]*p[i]*dis[d[i-1]][d[i]] + p[i-1]*(1-p[i])*dis[d[i-1]][c[i]] +
			 (1-p[i-1])*p[i]*dis[c[i-1]][d[i]] + (1-p[i-1])*(1-p[i])*dis[c[i-1]][c[i]]
		 );
	 }
}
ans=1.0*inf;
for(int j=0;j<=m;j++) for(int k=0;k<=1;k++) ans=fmin(ans,dp[n][j][k]);
printf("%.2lf\n",ans);

P3750 [六省联考2017]分手是祝愿

先考虑求出最小操作次数 $c$ 。

考虑从大到小枚举 $n$ 盏灯，若当前这盏灯是亮的，那么求将这盏灯熄灭，并更新左右它的约数。

若初始局面需要的最小操作次数小于等于 $k$ ，显然操作次数为最小操作次数。

我们可以预处理出 $dp(i)$ 表示有 $i$ 个选择变为 $i-1$ 个选择的最小操作次数。

则转移为：

\[dp(i)=\dfrac{i}{n}+\left(1-\dfrac{i}{n}\right)\times(1+dp(i)+dp(i+1))
\]

化简得：

\[dp(i)=1+\dfrac{(n-i)\times(dp(i+1)+1)}{i}
\]

则最终答案期望为：

\[k+\sum_{i=k+1}^{c}dp(i)
\]

别忘了最终答案乘上 $n!$ 。

$\texttt{code}$

n=rd(),k=rd();
for(int i=1;i<=n;i++) if(rd()) b[i]=true;
for(ll i=1;i<=n;i++) for(ll j=i;j<=n;j+=i) yue[j].pb(i);
for(int i=n;i>=1;i--) if(b[i])
{
	 for(int j:yue[i]) b[j]^=1;
	 cnt++;
}
if(cnt<=k) ans=cnt;
else
{
	 dp[n]=1;
	 for(ll i=n-1;i>=1;i--)
	 	 dp[i]=(1ll+(1ll*n-i)*(dp[i+1]+1ll)%mod*ksm(i,mod-2)%mod)%mod;
	 for(int i=k+1;i<=cnt;i++) ans=(ans+dp[i])%mod;
	 ans=(ans+k)%mod;
}
for(ll i=1;i<=n;i++) ans=ans*i%mod;
printf("%lld\n",ans);

期望概率DP的更多相关文章

HDU 3853 期望概率DP
期望概率DP简单题从[1,1]点走到[r,c]点,每走一步的代价为2 给出每一个点走相邻位置的概率,共3中方向,不动: [x,y]->[x][y]=p[x][y][0] , 右移:[x][y ...
【BZOJ 3652】大新闻数位dp+期望概率dp
并不难,只是和期望概率dp结合了一下.稍作推断就可以发现加密与不加密是两个互相独立的问题,这个时候我们分开算就好了.对于加密,我们按位统计和就好了;对于不加密,我们先假设所有数都找到了他能找到的最好的 ...
【BZOJ 3811】玛里苟斯大力观察+期望概率dp+线性基
大力观察:I.从输出精准位数的约束来观察,一定会有猫腻,然后仔细想一想,就会发现输出的时候小数点后面不是.5就是没有 II.从最后答案小于2^63可以看出当k大于等于3的时候就可以直接搜索了期望概率 ...
【NOIP模拟赛】黑红树期望概率dp
这是一道比较水的期望概率dp但是考场想歪了.......我们可以发现奇数一定是不能掉下来的,因为若奇数掉下来那么上一次偶数一定不会好好待着,那么我们考虑,一个点掉下来一定是有h/2-1个红(黑),h/ ...
BZOJ1415: [Noi2005]聪聪和可可最短路期望概率dp
首先这道题让我回忆了一下最短路算法,所以我在此做一个总结: 带权: Floyed:O(n3) SPFA:O(n+m),这是平均复杂度实际上为O(玄学) Dijkstra:O(n+2m),堆优化以后因 ...
期望概率DP
期望概率DP 1419: Red is good Description 桌面上有$R$张红牌和$B$张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付 ...
UVa 11427 Expect the Expected (数学期望 + 概率DP)
题意:某个人每天晚上都玩游戏,如果第一次就䊨了就高兴的去睡觉了,否则就继续直到赢的局数的比例严格大于 p,并且他每局获胜的概率也是 p,但是你最玩 n 局,但是如果比例一直超不过 p 的话,你将不高兴 ...
Hello 2019 D 素因子贡献法计算期望 + 概率dp + 滚动数组
https://codeforces.com/contest/1097/problem/D 题意给你一个n和k,问n经过k次操作之后留下的n的期望,每次操作n随机变成一个n的因数题解概率dp计算 ...
【BZOJ 3925】[Zjoi2015]地震后的幻想乡期望概率dp+状态压缩+图论知识+组合数学
神™题........ 这道题的提示......(用本苣蒻并不会的积分积出来的)并没有没有什么卵用 ,所以你发现没有那个东西并不会不影响你做题 ,然后你就可以推断出来你要求的是我们最晚挑到第几大的 ...
BZOJ2337: [HNOI2011]XOR和路径期望概率dp 高斯
这个题让我认识到我以往对于图上期望概率的认识是不完整的,我之前只知道正着退还硬生生的AC做过的所有图,那么现在让我来说一下逆退,一般来说对于概率性的东西都只是正推,因为有了他爸爸才有了他,而对于期望性 ...

随机推荐

分布式必备理论基础：CAP和BASE
大家好,我是老三,今天是没有刷题的一天,心情愉悦,给大家分享两个简单的知识点:分布式理论中的CAP和BASE. CAP理论什么是CAP CAP原则又称CAP定理,指的是在一个分布式系统中,Consi ...
Vue3.x全家桶+vite+TS-搭建Vue3.x项目
目录一.搭建基础项目 1.vite创建项目 3.运行项目 2.环境变量设置介绍 vite配置多环境打包二.配置Router 1.安装路由 2.配置路由 3.引入三.配置Vuex 1.安装vuex ...
CentOS8部署tftp
tftp:简单文本传输协议,而ftp:文本传输协议.可以把tftp看成是ftp的精简版.tftp用于免登录传输小文件,tftp服务端监听在udp协议的69端口tftp简单的工作原理: tftp服务端与 ...
网页兼容最新IE声明meta方法
第三种,总是使用最新版本文档模式. 以下是例子: <meta http-equiv="X-UA-Compatible" content="IE=edge" ...
mysql 复合索引为什么遵循最左原则
1,>mysql :多列索引 https://dev.mysql.com/doc/refman/5.7/en/multiple-column-indexes.html 1>,B+树: h ...
Linux服务器时间同步配置
Linux服务器时间同步配置以CentOS7 做时间服务器,其他服务器(Centos 6.RHEL7)同步该服务器时间 RHEL 7.CentOS 7 默认的网络时间协议为Chrony 本教程 ...
P5591-小猪佩奇学数学【单位根反演】
正题题目链接:https://www.luogu.com.cn/problem/P5591 题目大意给出$n,p,k$求 \[\left(\sum_{i=0}^n\binom{n}{i}p^i ...
SpringMVC的数据输出
使用 @Controller public class OutputController { @RequestMapping("/handle01") public String ...
Springboot实现VNC的反向代理
背景用户需要通过前端HTML页面的noVNC(noVNC是什么?)客户端连接底层VNC Server服务端,为了防止VNC Server的IP暴露,因此需要做一层代理.正常情况下使用Nginx. ...
redux搭配react-redux进行跨组件通信开发
Redux API 作用 createStore 用于创建一个store对象 bindActionCreators 用于简化操作,不用开发者手动触发dispatch React-redux API 作 ...

期望 概率DP

期望

期望（概率）DP

其他习题

P1850 换教室

P3750 [六省联考2017]分手是祝愿

期望 概率DP的更多相关文章

随机推荐

热门专题

期望概率DP

期望概率DP的更多相关文章