BZOJ.1076.[SCOI2008]奖励关(概率DP 倒推)

真的题意不明啊。。

\(Description\)
你有k次选择的机会，每次将从n种物品中随机一件给你，你可以选择选或不选。选择它会获得这种物品的价值；选择一件物品前需要先选择某些种物品每种至少一件。
物品价值可能有负。问在最优策略下期望得分。

\(Solution\)
并不像期望DP。。(这题倒推也不是因为像期望DP那样)
最优解我以为还要贪心，其实只需要在枚举过程中取个max。。

数据范围显然可以用f[i][s]表示当前是第i次，选择过的物品的集合为s时的最大期望得分。
枚举次数i，枚举当前集合状态s，再枚举出现的物品：若能选，在选与不选间取max；不能选直接转移(加上)。每个物品的概率都是1/n，之后再除以n就是状态的期望得分。
这样只能从有转移到无或有。

如果正推的话，在枚举当前状态时，会得到的状态可能是各种各样的，不好算(必须要算出概率，还会小到存不下？)；而且最终状态集合需要枚举？(我也没写过，应该会特别麻烦。。见xxy博客)
(别人是说可能从无效到有效。。方式不同吧我想的其实和倒推差不了多少)

//27192kb	820ms
#include <cstdio>
#include <cctype>
#include <algorithm>
#define gc() getchar()

int K,n,need[17],val[17];
double f[103][(1<<15)+3];

inline int read()
{
	int now=0,f=1;register char c=gc();
	for(;!isdigit(c);c=gc()) if(c=='-') f=-1;
	for(;isdigit(c);now=now*10+c-'0',c=gc());
	return now*f;
}

int main()
{
	K=read(),n=read();
	for(int v,i=0; i<n; ++i)
		for(val[i]=read(),v=read(); v; v=read())
			need[i]|=(1<<v-1);
	int lim=1<<n;
	for(int i=K; i; --i)
		for(int j=0; j<lim; ++j)
		{
			for(int k=0; k<n; ++k)
				if((j&need[k])==need[k])
					f[i][j]+=std::max(f[i+1][j],f[i+1][j|(1<<k)]+val[k]);
				else f[i][j]+=f[i+1][j];
			f[i][j]/=n;
		}
	printf("%.6lf",f[1][0]);

	return 0;
}

posted @ 2018-03-28 20:59 SovietPower 阅读(266) 评论(0) 收藏举报

刷新页面返回顶部

SovietPower

因你而起的一泓喜悲权当年轻留个纪念

BZOJ.1076.[SCOI2008]奖励关(概率DP 倒推)

公告

SovietPower

因你而起的一泓喜悲 权当年轻 留个纪念

BZOJ.1076.[SCOI2008]奖励关(概率DP 倒推)

公告

因你而起的一泓喜悲权当年轻留个纪念