[BZOJ 1076][SCOI2008]奖励关
1076: [SCOI2008]奖励关
Time Limit: 10 Sec Memory Limit: 128 MB
Submit: 2707 Solved: 1423
[Submit][Status][Discuss]Description
你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关。在这个奖励关里,系统将依次随机抛出k次宝物,
每次你都可以选择吃或者不吃(必须在抛出下一个宝物之前做出选择,且现在决定不吃的宝物以后也不能再吃)。
宝物一共有n种,系统每次抛出这n种宝物的概率都相同且相互独立。也就是说,即使前k-1次系统都抛出宝物1(
这种情况是有可能出现的,尽管概率非常小),第k次抛出各个宝物的概率依然均为1/n。 获取第i种宝物将得到Pi
分,但并不是每种宝物都是可以随意获取的。第i种宝物有一个前提宝物集合Si。只有当Si中所有宝物都至少吃过
一次,才能吃第i种宝物(如果系统抛出了一个目前不能吃的宝物,相当于白白的损失了一次机会)。注意,Pi可
以是负数,但如果它是很多高分宝物的前提,损失短期利益而吃掉这个负分宝物将获得更大的长期利益。 假设你
采取最优策略,平均情况你一共能在奖励关得到多少分值?Input
第一行为两个正整数k和n,即宝物的数量和种类。以下n行分别描述一种宝物,其中第一个整数代表分值,随
后的整数依次代表该宝物的各个前提宝物(各宝物编号为1到n),以0结尾。Output
输出一个实数,保留六位小数,即在最优策略下平均情况的得分。
Sample Input
1 2
1 0
2 0Sample Output
1.500000HINT
【数据规模】
1<=k<=100,1<=n<=15,分值为[-10^6,10^6]内的整数。
题解
看数据范围似乎有点状压DP的节奏...然而久WA不过QAQ
听从dg教导"不要恋战"之后跑去查了po姐的题解(滑稽)
然后发现居然还有倒着维护这种操作(!!!)简直神妙QAQ
状态就是当前吃过哪些宝物了...直接AND一下判断能否吃当前宝物, 能吃就在吃或不吃之间取最大值转移, 不能吃就直接转移.
(果然还是要多做题...不然这样的神妙想法根本想不到QAQ)
参考代码
1 #include <cstdio> 2 #include <cstring> 3 #include <cstdlib> 4 #include <iostream> 5 #include <algorithm> 6 7 const int MAXN=16; 8 const int MAXK=110; 9 10 int n; 11 int k; 12 double p; 13 int pre[MAXN]; 14 double value[MAXN]; 15 double dp[MAXK][1<<MAXN]; 16 17 void Initialize(); 18 void DynamicProgramming(int); 19 20 int main(){ 21 Initialize(); 22 for(int i=k;i>0;i--){ 23 for(int j=0;j<(1<<n);j++){ 24 for(int k=0;k<n;k++){ 25 if((j&pre[k])==pre[k]) 26 dp[i][j]+=std::max(dp[i+1][j|(1<<k)]+value[k],dp[i+1][j])/n; 27 else 28 dp[i][j]+=dp[i+1][j]/n; 29 } 30 } 31 } 32 printf("%.6lf\n",dp[1][0]); 33 return 0; 34 } 35 36 void Initialize(){ 37 int a; 38 int b; 39 scanf("%d%d",&k,&n); 40 for(int i=0;i<n;i++){ 41 scanf("%lf",value+i); 42 while(scanf("%d",&b),b!=0){ 43 pre[i]|=(1<<(b-1)); 44 } 45 } 46 p=1.0/n; 47 }
本博客已弃用, 新个人主页: https://rvalue.moe, 新博客: https://blog.rvalue.moe