概率dp集合
bzoj1076
你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关。在这个奖励关里,系统将依次随机抛出k次宝物,
每次你都可以选择吃或者不吃(必须在抛出下一个宝物之前做出选择,且现在决定不吃的宝物以后也不能再吃)。
宝物一共有n种,系统每次抛出这n种宝物的概率都相同且相互独立。也就是说,即使前k-1次系统都抛出宝物1(
这种情况是有可能出现的,尽管概率非常小),第k次抛出各个宝物的概率依然均为1/n。 获取第i种宝物将得到Pi
分,但并不是每种宝物都是可以随意获取的。第i种宝物有一个前提宝物集合Si。只有当Si中所有宝物都至少吃过
一次,才能吃第i种宝物(如果系统抛出了一个目前不能吃的宝物,相当于白白的损失了一次机会)。注意,Pi可
以是负数,但如果它是很多高分宝物的前提,损失短期利益而吃掉这个负分宝物将获得更大的长期利益。 假设你
采取最优策略,平均情况你一共能在奖励关得到多少分值?
题解:套了概率的记忆化搜索;
1 #include<iostream> 2 #include<cstdio> 3 #include<cstring> 4 #include<string> 5 #include<cstdlib> 6 #include<cmath> 7 #include<ctime> 8 #include<algorithm> 9 #include<iomanip> 10 using namespace std; 11 #define LL long long 12 #define up(i,j,n) for(int i=(j);i<=(n);i++) 13 #define FILE "dealing" 14 int read(){ 15 int f=1,x=0,ch=getchar(); 16 while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();} 17 while(ch>='0'&&ch<='9')x=(x<<1)+(x<<3)+ch-'0',ch=getchar(); 18 return f*x; 19 } 20 const int maxn=1010; 21 const double eps=0.0000001; 22 int k,n; 23 double v[maxn];//分数 24 int d[maxn][maxn],cnt[maxn];//前提集合 25 double f[110][50000]; 26 inline bool cmp(double x,double y){return abs(x-y)<=eps;} 27 double dfs(int pos,int S){ 28 if(pos==0)return f[pos][S]=0; 29 if(!cmp(f[pos][S],-1))return f[pos][S]; 30 f[pos][S]=0; 31 up(i,1,n){ 32 bool flag=1; 33 up(j,1,cnt[i])if(!(S&(1<<d[i][j]-1)))flag=0; 34 if(flag)f[pos][S]+=max(dfs(pos-1,S|(1<<i-1))+v[i],dfs(pos-1,S)); 35 else f[pos][S]+=dfs(pos-1,S); 36 } 37 f[pos][S]/=(n*1.0); 38 return f[pos][S]; 39 } 40 int main(){ 41 freopen(FILE".in","r",stdin); 42 freopen(FILE".out","w",stdout); 43 k=read(),n=read(); 44 up(i,1,n){ 45 v[i]=read();int x=read(); 46 while(x){ 47 d[i][++cnt[i]]=x; 48 x=read(); 49 } 50 } 51 up(i,1,k)up(j,0,(1<<n)-1)f[i][j]=-1; 52 printf("%.6lf\n",dfs(k,0)); 53 return 0; 54 }
bzoj1415
这题题目描述我感觉有问题;
标解是按每次聪聪都走两步算的,而我认为聪聪可能只走一步;
其他的就按普通的概率dp计算即可;
1 #include<iostream> 2 #include<cstdio> 3 #include<cstring> 4 #include<string> 5 #include<cstdlib> 6 #include<cmath> 7 #include<ctime> 8 #include<algorithm> 9 #include<iomanip> 10 using namespace std; 11 #define LL long long 12 #define up(i,j,n) for(int i=(j);i<=(n);i++) 13 #define FILE "dealing" 14 int read(){ 15 int f=1,x=0,ch=getchar(); 16 while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();} 17 while(ch>='0'&&ch<='9')x=(x<<1)+(x<<3)+ch-'0',ch=getchar(); 18 return f*x; 19 } 20 const int maxn=2010; 21 const double eps=0.0000001; 22 int n,m,sx,sy; 23 struct node{ 24 int y,next; 25 }e[maxn<<4]; 26 int linkk[maxn],len=0; 27 void insert(int x,int y){ 28 e[++len].y=y; 29 e[len].next=linkk[x]; 30 linkk[x]=len; 31 } 32 int q[maxn<<4],head,tail; 33 int next[maxn][maxn],d[maxn]; 34 void bfs(int s){ 35 head=tail=0; 36 memset(next[s],10,sizeof(next[s])); 37 memset(d,0,sizeof(d)); 38 q[++tail]=s;int x; 39 next[s][s]=0;d[s]=1; 40 while(++head<=tail){ 41 x=q[head]; 42 for(int i=linkk[x];i;i=e[i].next){ 43 if(!d[e[i].y])next[s][e[i].y]=x,d[e[i].y]=d[x]+1,q[++tail]=e[i].y; 44 if(d[e[i].y]>d[x]&&next[s][e[i].y]>x)next[s][e[i].y]=x; 45 } 46 } 47 } 48 double f[maxn][maxn]; 49 double dfs(int x,int y){ 50 if(x==y)return 0; 51 if(f[x][y]!=-1)return f[x][y]; 52 if(next[x][y]==x||next[x][next[x][y]]==x)return f[x][y]=1; 53 int sum=1; 54 f[x][y]=0; 55 for(int i=linkk[x];i;i=e[i].next) 56 sum++,f[x][y]+=dfs(e[i].y,next[x][next[x][y]]); 57 f[x][y]+=dfs(x,next[x][next[x][y]]); 58 f[x][y]=f[x][y]/sum+1; 59 return f[x][y]; 60 } 61 int main(){ 62 freopen(FILE".in","r",stdin); 63 freopen(FILE".out","w",stdout); 64 n=read(),m=read(),sx=read(),sy=read(); 65 up(i,1,m){ 66 int x=read(),y=read(); 67 insert(x,y),insert(y,x); 68 } 69 up(i,1,n)bfs(i); 70 up(i,1,n)up(j,1,n)f[i][j]=-1; 71 printf("%.3lf\n",dfs(sy,sx)); 72 return 0; 73 }
bzoj1426收集邮票
有n种不同的邮票,皮皮想收集所有种类的邮票。唯一的收集方法是到同学凡凡那里购买,每次只能买一张,并且买到的邮票究竟是n种邮票中的哪一种是等概率的,概率均为1/n。但是由于凡凡也很喜欢邮票,所以皮皮购买第k张邮票需要支付k元钱。 现在皮皮手中没有邮票,皮皮想知道自己得到所有种类的邮票需要花费的钱数目的期望。
这题还是很神奇的;
设f[i]表示已经有了i张邮票还需要花费f[i]单位的钱买全所有邮票;
设g[i]表示买了i张邮票还需要买g[i]张邮票才能买全邮票;
g[i]很好求,买第i张邮票成功的概率(n-i)/n,第i张邮票买n/(n-i)次,然后累加就可以了;
怎么处理钱数?我们不如先给钱数多的钱,也就是说在期望再买k次就能买全的时候,买这一张用k元,之后递减,可以证明这两种付款等价;
也可以视为这张票是1元买的,而后面的每张票都贵了1元;
于是有了递推式子:
f[i]=(n-i)/n*(f[i+1]+g[i+1]+1)+i/n*(g[i]+f[i]+1)
经过转化,有了这个式子
f[i]=f[i+1]+g[i+1]+i/(n-i)*g[i]+n/(n-i)
递推即可;
1 #include<iostream> 2 #include<cstdio> 3 #include<cstring> 4 #include<string> 5 #include<cstdlib> 6 #include<cmath> 7 #include<ctime> 8 #include<algorithm> 9 #include<iomanip> 10 using namespace std; 11 #define LL long long 12 #define up(i,j,n) for(int i=(j);i<=(n);i++) 13 #define FILE "dealing" 14 int read(){ 15 int f=1,x=0,ch=getchar(); 16 while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();} 17 while(ch>='0'&&ch<='9')x=(x<<1)+(x<<3)+ch-'0',ch=getchar(); 18 return f*x; 19 } 20 const int maxn=10100; 21 const double eps=0.0000001; 22 int n; 23 double g[maxn],f[maxn]; 24 double dfs(int i){ 25 if(i==n)return 0; 26 return dfs(i+1)+g[i+1]+i*1.0/(n-i)*g[i]+n*1.0/(n-i); 27 } 28 int main(){ 29 freopen(FILE".in","r",stdin); 30 freopen(FILE".out","w",stdout); 31 n=read(); 32 for(int i=n-1;i>=0;i--)g[i]=g[i+1]+n*1.0/(n-i); 33 printf("%.2lf\n",dfs(0)); 34 return 0; 35 }
bzoj4008: [HNOI2015]亚瑟王
小 K 不慎被 LL 邪教洗脑了,洗脑程度深到他甚至想要从亚瑟王邪教中脱坑。
1 #include<iostream> 2 #include<cstdio> 3 #include<cstring> 4 #include<string> 5 #include<cstdlib> 6 #include<cmath> 7 #include<ctime> 8 #include<algorithm> 9 #include<iomanip> 10 using namespace std; 11 #define LL long long 12 #define up(i,j,n) for(int i=(j);i<=(n);i++) 13 #define FILE "dealing" 14 int read(){ 15 int f=1,x=0,ch=getchar(); 16 while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();} 17 while(ch>='0'&&ch<='9')x=(x<<1)+(x<<3)+ch-'0',ch=getchar(); 18 return f*x; 19 } 20 const int maxn=1010; 21 const double eps=0.0000001; 22 int T,n,r; 23 double d[222],p[222],f[222][222],g[222]; 24 double mi(double a,int b){ 25 double ans=1; 26 while(b){ 27 if(b%2)ans*=a; 28 b/=2; 29 a*=a; 30 } 31 return ans; 32 } 33 int main(){ 34 freopen(FILE".in","r",stdin); 35 freopen(FILE".out","w",stdout); 36 T=read(); 37 while(T--){ 38 n=read(),r=read(); 39 up(i,1,n)scanf("%lf%lf",&p[i],&d[i]); 40 memset(f,0,sizeof(f)); 41 memset(g,0,sizeof(g)); 42 f[0][0]=1; 43 up(i,1,n)up(j,0,min(i,r)){ 44 f[i][j]=f[i-1][j]*mi(1-p[i],r-j)+((j-1>=0)?(f[i-1][j-1]*(1-mi(1-p[i],r-j+1))):(0)); 45 } 46 up(i,1,n)up(j,0,i-1)g[i]+=f[i-1][j]*mi(1-p[i],r-j); 47 double ans=0; 48 up(i,1,n)ans+=(1-g[i])*d[i]; 49 printf("%.10lf\n",ans); 50 } 51 return 0; 52 }