BZOJ1076: [SCOI2008]奖励关
1076: [SCOI2008]奖励关
Time Limit: 10 Sec Memory Limit: 162 MBSubmit: 727 Solved: 431
[Submit][Status]
Description
你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关。在这个奖励关里,系统将依次随机抛出k次宝物,每次你都可以选择吃或者不吃(必须在抛出下一个宝物之前做出选择,且现在决定不吃的宝物以后也不能再吃)。 宝物一共有n种,系统每次抛出这n种宝物的概率都相同且相互独立。也就是说,即使前k-1次系统都抛出宝物1(这种情况是有可能出现的,尽管概率非常小),第k次抛出各个宝物的概率依然均为1/n。 获取第i种宝物将得到Pi分,但并不是每种宝物都是可以随意获取的。第i种宝物有一个前提宝物集合Si。只有当Si中所有宝物都至少吃过一次,才能吃第i种宝物(如果系统抛出了一个目前不能吃的宝物,相当于白白的损失了一次机会)。注意,Pi可以是负数,但如果它是很多高分宝物的前提,损失短期利益而吃掉这个负分宝物将获得更大的长期利益。 假设你采取最优策略,平均情况你一共能在奖励关得到多少分值?
Input
第一行为两个正整数k和n,即宝物的数量和种类。以下n行分别描述一种宝物,其中第一个整数代表分值,随后的整数依次代表该宝物的各个前提宝物(各宝物编号为1到n),以0结尾。
Output
输出一个实数,保留六位小数,即在最优策略下平均情况的得分。
Sample Input
1 0
2 0
Sample Output
HINT
【样例2】 Input 6 6 12 2 3 4 5 0 15 5 0 -2 2 4 5 0 -11 2 5 0 5 0 1 2 4 5 0 Output 10.023470 【数据规模】 1<=k<=100,1<=n<=15,分值为[-10^6,10^6]内的整数。
容易想到集合DP
1,这一步的期望=(上一步的期望+这一步的得分)/K
2,倒推会好做很多,因为最后的答案就是F[1][0]。顺推不好判断当前状态是否有效。(倒推是有效从有效推来,无效随便,因为答案就是一个有效状态;而顺推则可能从无效推到有效)
代码:
1 uses math; 2 const maxn=100+20; 3 var w,a:array[0..maxn] of longint; 4 x,i,j,k,n,m:longint; 5 f:array[0..maxn,0..1 shl 16] of double; 6 procedure init; 7 begin 8 readln(n,m); 9 for i:=1 to m do 10 begin 11 read(w[i]);a[i]:=0; 12 read(x); 13 while x<>0 do 14 begin 15 inc(a[i],1<<(x-1)); 16 read(x); 17 end; 18 readln; 19 end; 20 end; 21 procedure main; 22 begin 23 for i:=n downto 1 do 24 for j:=0 to 1<<m-1 do 25 begin 26 f[i,j]:=0.0; 27 for k:=1 to m do 28 if j and a[k]<>a[k] then f[i,j]:=f[i,j]+f[i+1,j] 29 else 30 f[i,j]:=f[i,j]+max(f[i+1,j],f[i+1,j or (1<<(k-1))]+w[k]); 31 f[i,j]:=f[i,j]/m; 32 //writeln(i,' ',j,' ',f[i,j]); 33 end; 34 writeln(f[1,0]:0:6); 35 end; 36 37 begin 38 assign(input,'input.txt');assign(output,'output.txt'); 39 reset(input);rewrite(output); 40 init; 41 main; 42 close(input);close(output); 43 end.