coin
数据范围:\(n<=3000,m<=300\),保证\(\forall i,\sum\limits_{j}p_{ij}=1000\)
Solution
日常期望算不对。。
首先比较明显的一点是,每种类型是独立的,我们可以分开来考虑
先来想一个比较直接的dp
用\(a[i][j]\)表示第\(i\)个人最喜欢\(j\)的概率,记\(f[c][i][j]\)表示前\(i\)个人里面恰好有\(j\)个人最喜爱类型\(c\),转移显然:
再考虑用\(g[i][j]\)表示第\(i\)种钞票携带了\(j\)张,期望拿走的数量,那么有转移:
然后我们就可以用一个背包求出答案了,但是这样无论是空间还是时间都很爆炸
考虑\(\nabla g[i][j]=g[i][j]-g[i][j-1]\),也就是\(\nabla g[i][j]=\sum\limits_{k=j}^m f[i][n][k]\),首先注意到\(f[i][n][k]\)在\(i\)确定的情况下大小一定是随着\(k\)的增大而增大的,然后再看回这个\(\nabla g[i][j]\),显然这个东西的值应该是非负的,并且当\(i\)一定,\(\nabla g[i][j]\)的值随着\(j\)的增大而单调不升
所以我们可以得到一个结论,当\(i\)确定的时候,\(g[i][j]\)是不降的,并且增幅逐渐下降
然后又因为每种钞票是独立的,我们可以考虑一个贪心
枚举\(n\)张钞票的每一张都选什么,对于每一种钞票\(c\),我们维护一个隐性的\(p_c\)(说是“隐性”是因为在实现的时候你并不需要真的去维护这么一个东西),表示钞票\(c\)当前已经取了\(p_c\)张,那么从贪心的角度来看,我们当前枚举到的这张钞票,肯定希望新加入这张钞票之后,对应的\(g[c]\)的增幅最大,所以就可以得到一个大致的流程:从\(1\)到\(n\)枚举每一张钞票选什么,对于第\(i\)张钞票,\(O(m)\)求得最大的\(g\)的增幅,加入答案,然后对于选择的这个种类\(c\),更新其\(g\)值
现在的问题就是怎么维护增幅,为了方便下面只针对确定的\(c\)类钞票进行表述
一开始的时候\(p_c=0\),\(g[c][0]\)到\(g[c][1]\)的增幅是很好计算的,\(\nabla g[c][1]=1-\prod\limits_{i=1}^n(1-a[i][c])\),但是\(\nabla g[c][2]\)看起来就不能那么直接地进行计算了,所以我们还是看回这个式子:\(\nabla g[i][j]=\sum\limits_{k=j}^mf[i][n][k]=1-\sum\limits_{k=0}^{j-1}f[i][n][k]\),那所以我们只要对于第\(c\)种钞票维护\(f[c][i][j]\)就好,然后维护一个\(sum[c]=\sum\limits_{k=0}^{p_c}f[c][n][k]\),每次更新完\(f[c]\)之后把\(f[c][n][p_c]\)加到\(sum[c]\)里面就好了
接下来就是空间怎么解决:对于\(f[c][i][j]\)来说,我们是按照\(j\)进行dp的,显然\(j\)那维可以滚动掉,\(f[c][][j]\)到\(f[c][][j+1]\)的更新是\(O(n)\)的,然后我们就获得了一个\(O(nm)\)的算法
mark:(弱智操作)谁告诉你听算期望的时候可以钦定顺序的???
Code
#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
const int N=3010,M=310;
double sum[N],f[2][M][N];
double a[N][M];
int now[M],pre[M];
int n,m;
double ans;
void dp(int x){
swap(now[x],pre[x]);
int Now=now[x],Pre=pre[x];
f[Now][x][0]=0;
for (int i=1;i<=n;++i)
f[Now][x][i]=f[Now][x][i-1]*(1-a[i][x])+f[Pre][x][i-1]*a[i][x];
}
int main(){
#ifndef ONLINE_JUDGE
freopen("a.in","r",stdin);
#endif
int x;
scanf("%d%d",&n,&m);
for (int i=1;i<=n;++i)
for (int j=1;j<=m;++j)
scanf("%d",&x),a[i][j]=1.0*x/1000;
for (int i=1;i<=m;++i){
f[0][i][0]=1;
for (int j=1;j<=n;++j)
f[0][i][j]=f[0][i][j-1]*(1-a[j][i]);
sum[i]=f[0][i][n];
}
for (int i=1;i<=m;++i) now[i]=0,pre[i]=1;
int which;
double mx;
for (int j=1;j<=n;++j){
mx=0; which=-1;
for (int i=1;i<=m;++i)
if (1-sum[i]>mx)
which=i,mx=1-sum[i];
ans+=mx;
dp(which);
sum[which]+=f[now[which]][which][n];
}
printf("%.10lf\n",ans);
}