题目描述

你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关。在这个奖励关里,系统将依次随机抛出k次宝物,每次你都可以选择吃或者不吃(必须在抛出下一个宝物之前做出选择,且现在决定不吃的宝物以后也不能再吃)。

宝物一共有n种,系统每次抛出这n种宝物的概率都相同且相互独立。也就是说,即使前k-1 次系统都抛出宝物1(这种情况是有可能出现的,尽管概率非常小),第k次抛出各个宝物的概率依然均为1/n。

获取第 i 种宝物将得到Pi分,但并不是每种宝物都是可以随意获取的。第i种宝物有一个前提宝物集合Si。只有当Si中所有宝物都至少吃过一次,才能吃第i 种宝物(如果系统抛出了一个目前不能吃的宝物,相当于白白的损失了一次机会)。注意,Pi 可以是负数,但如果它是很多高分宝物的前提,损失短期利益而吃掉这个负分宝物将获得更大的长期利益。

假设你采取最优策略,平均情况你一共能在奖励关得到多少分值?

输入输出格式

输入格式:

第一行为两个正整数k 和n,即宝物的数量和种类。以下n行分别描述一种

宝物,其中第一个整数代表分值,随后的整数依次代表该宝物的各个前提宝物(各

宝物编号为1到n),以0结尾。

输出格式:

输出一个实数,保留六位小数,即在最优策略下平均情况的得分。

输入输出样例


输入样例#1:

1 2
1 0
2 0

输出样例#1:

1.500000


输入样例#2:

6 6
12 2 3 4 5 0
15 5 0
-2 2 4 5 0
-11 2 5 0
5 0
1 2 4 5 0

输出样例#2:

10.023470


说明

1 <= k <= 100, 1 <= n <= 15,分值为[-106,106]内的整数。


题解

这是一道状压dp题,数据范围很小,只有15(很标准啊)

首先,解释一下题意,会有k个宝物掉下,共n种,所以每次每种宝物掉下的概率都是1/n,而题目最后说的最优策略是指这次掉下的宝物,你可以不选,这是因为它的贡献是负数且它对后面的宝物是没用的,平均情况是指每次掉下每种宝物的情况都是1/n,所以我们要将所得的期望得分/n,即

本轮期望=(上一轮期望+本轮得分)/n

而正向推的话可能会出现从合法情况推到不合法的情况,那么这种情况乱再推也是没用的,所以我们倒着推,保证统计结果时一定合法(听说最优策略的期望dp都是倒着推???),那么结果最后就保存在dp[1][0]

设dp[i][j]表示第i轮已经收集的宝物集合j的期望

那么状态转移方程就变成了这样

if(本宝物可以收集)

  dp[i][j]+=max(dp[i+1][j],dp[i+1][j|1<<(k-1)]+v[k])/n//v[]表示宝物价值

else

  dp[i][j]+=dp[i+1][j]/n;

 #include<bits/stdc++.h>
#define in(i) (i=read())
using namespace std;
int read()
{
int ans=,f=;
char i=getchar();
while(i<'' || i>'')
{
if(i=='-') f=-;
i=getchar();
}
while(i>='' && i<='')
{
ans=(ans<<)+(ans<<)+i-'';
i=getchar();
}
return ans*f;
}
int m,n;
int cur[];
int v[];
double dp[][];
int main()
{
in(m);in(n);
for(int i=;i<=n;i++)
{
in(v[i]);
int u;
in(u);
while(u)
{
cur[i]|=<<(u-);
in(u);
}
}
int tot=<<n;
for(int i=m;i>=;i--)
{
for(int j=;j<tot;j++)
{
for(int k=;k<=n;k++)
{
if((cur[k]&j)==cur[k]) dp[i][j]+=max(dp[i+][j],dp[i+][j|<<(k-)]+v[k])/n;
else dp[i][j]+=dp[i+][j]/n;
}
// dp[i][j]/=n;
}
}
printf("%0.6lf\n",dp[][]);
return ;
}
 #include<bits/stdc++.h>
#define in(i) (i=read())
using namespace std;
int read()
{
int ans=,f=;
char i=getchar();
while(i<'' || i>'')
{
if(i=='-') f=-;
i=getchar();
}
while(i>='' && i<='')
{
ans=(ans<<)+(ans<<)+i-'';
i=getchar();
}
return ans*f;
}
int m,n;
int cur[];
int v[];
double dp[][];
int main()
{
in(m);in(n);
for(int i=;i<=n;i++)
{
in(v[i]);
int u;
in(u);
while(u)
{
cur[i]|=<<(u-);
in(u);
}
}
int tot=<<n;
for(int i=m;i>=;i--)
{
for(int j=;j<tot;j++)
{
for(int k=;k<=n;k++)
{
if((cur[k]&j)==cur[k]) dp[i][j]+=max(dp[i+][j],dp[i+][j|<<(k-)]+v[k])/n;
else dp[i][j]+=dp[i+][j]/n;
}
// dp[i][j]/=n;
}
}
printf("%0.6lf\n",dp[][]);
return ;

SCOI2008奖励关 [状压dp]的更多相关文章

  1. 【BZOJ1076】[SCOI2008]奖励关 状压DP+期望

    [BZOJ1076][SCOI2008]奖励关 Description 你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关.在这个奖励关里,系统将依次随机抛出k次宝物,每次你都可以选择吃或者不吃(必须 ...

  2. B1076 [SCOI2008]奖励关 状压dp&&期望dp

    这个题的n<15,一看就是状压dp.但是状态不是很好想.f[][]存i关的状态j. 这个题另一个关键思想在于倒推,我一开始想的是正推,但是只能记忆化了. 题干: 题目描述 你正在玩你最喜欢的电子 ...

  3. [BZOJ1076][SCOI2008]奖励关 状压dp

    1076: [SCOI2008]奖励关 Time Limit: 10 Sec  Memory Limit: 128 MBSubmit: 3070  Solved: 1595[Submit][Statu ...

  4. BZOJ1076:[SCOI2008]奖励关(状压DP,期望)

    Description 你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关.在这个奖励关里,系统将依次随机抛出k次宝物, 每次你都可以选择吃或者不吃(必须在抛出下一个宝物之前做出选择,且现在决定不吃的 ...

  5. 洛谷 P2473 [SCOI2008]奖励关(状压dp+期望)

    题面 luogu 题解 \(n \leq 15\) 状压 \(f[i][S]\)表示第\(i\)轮,吃过的集合为\(S\) 正着转移好像有点复杂 考虑逆推转移(正着转移应该也行) \(f[i][S]\ ...

  6. 洛谷P2473奖励关——状压DP

    题目:https://www.luogu.org/problemnew/show/P2473 还是对DP套路不熟悉... 像这种前面影响后面,而后面不影响前面的问题就应该考虑倒序递推: 看n只有15那 ...

  7. [SCOI2008]奖励关 - 状压动规 - 概率与期望

    Description 你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关.在这个奖励关里,系统将依次随机抛出k次宝物,每次你都可以选择吃或者不吃(必须在抛出下一个宝物之前做出选择,且现在决定不吃的宝 ...

  8. 【洛谷】2473:[SCOI2008]奖励关【期望DP(倒推)】

    P2473 [SCOI2008]奖励关 题目背景 08四川NOI省选 题目描述 你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关.在这个奖励关里,系统将依次随机抛出k次宝物,每次你都可以选择吃或者不 ...

  9. [SCOI2008]奖励关(期望dp)

    你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关.在这个奖励关里,系统将依次随机抛出k次宝物,每次你都可以选择吃或者不吃(必须在抛出下一个宝物之前做出选择,且现在决定不吃的宝物以后也不能再吃). 宝 ...

随机推荐

  1. py3.7.1下pyinstaller 的安装及打包 坑

    实在无语了,写了个小程序,用pyinstaller打包,运行就出现这个pip install pywin32-ctypes.明明全部都已经安装了啊. 解决办法: 不要在工程设置里安装pyinstall ...

  2. idea 普通文件夹 转换成 module

    经常会遇到从GitHub上download的progect在idea里面打开是普通文件夹形式,而并不是我们想要的module形式(文件夹图标右下角有个蓝色的tag),那么如何快速转换成我们想要的mod ...

  3. (数据科学学习手札04)Python与R在自定义函数上的异同

    自编函数是几乎每一种编程语言的基础功能,有些时候我们需要解决的问题可能没有完全一致的包中的函数来进行解决,这个时候自编函数就成了一样利器,而Python与R在这方面也有着一定的差别,下面举例说明: P ...

  4. 剑指offer题目系列二

    本篇延续上一篇,介绍<剑指offer>第二版中的四个题目:从尾到头打印链表.用两个栈实现队列.旋转数组的最小数字.二进制中1的个数. 5.从尾到头打印链表 题目:输入一个链表的头结点,从尾 ...

  5. octave简易操作

    语言以分号;结尾if for while等语句后用,来承接关系if ,elseif ,else ,end;for i=1:10,end;while a>3 ,end;   while true, ...

  6. Lucene如何实现多条件搜索?

    有两种方式可以实现, 一是:Lucene搜索API中提供了一个布尔查询器(BooleanQuery),它可以包含多个查询器,每个查询器Occur枚举控制是“and” 还是“or” BooleanQue ...

  7. python基础之socket套接字基础part2

    基于UDP的socket 面向无连接的不可靠数据传输,可以没有服务器端,只不过没有服务器端,发送的数据会被直接丢弃,并不能到达服务器端 1 #客户端 2 import socket 3 ip_port ...

  8. 谈谈WPF中的CollectionView与CollectionViewSource (1)

    原文:谈谈WPF中的CollectionView与CollectionViewSource (1) 谈谈WPF中的CollectionView与CollectionViewSource (1)     ...

  9. struts2官方 中文教程 系列十:Form标签

    介绍 在本教程中,我们将探索其他Struts 2表单控件.在前面的教程中,我们介绍了如何使用Struts 2表单(处理表单.表单验证和消息资源文件),我们介绍了如何使用Struts 2 head, f ...

  10. Leetcode代码补全——链表

    通过补全代码可以更深刻的体会到,链表就是一个存储方式,通过一单元的存储指向下一单元,而查看单元内容通过头部开始的指针依次遍历.这是leetcode里融合两个链表的题目,具体代码如下: #encodin ...