概率dp poj2096
1 /** 2 dp求期望的题。 3 题意:一个软件有s个子系统,会产生n种bug。 4 某人一天发现一个bug,这个bug属于某种bug,发生在某个子系统中。 5 求找到所有的n种bug,且每个子系统都找到bug,这样所要的天数的期望。 6 需要注意的是:bug的数量是无穷大的,所以发现一个bug,出现在某个子系统的概率是1/s, 7 属于某种类型的概率是1/n。 8 解法: 9 dp[i][j]表示已经找到i种bug,并存在于j个子系统中,要达到目标状态的天数的期望。 10 显然,dp[n][s]=0,因为已经达到目标了。而dp[0][0]就是我们要求的答案。 11 dp[i][j]状态可以转化成以下四种: 12 dp[i][j] 发现一个bug属于已经找到的i种bug和j个子系统中 13 dp[i+1][j] 发现一个bug属于新的一种bug,但属于已经找到的j种子系统 14 dp[i][j+1] 发现一个bug属于已经找到的i种bug,但属于新的子系统 15 dp[i+1][j+1]发现一个bug属于新的一种bug和新的一个子系统 16 以上四种的概率分别为: 17 p1 = i*j / (n*s) 18 p2 = (n-i)*j / (n*s) 19 p3 = i*(s-j) / (n*s) 20 p4 = (n-i)*(s-j) / (n*s) 21 又有:期望可以分解成多个子期望的加权和,权为子期望发生的概率,即 E(aA+bB+...) = aE(A) + bE(B) +... 22 所以: 23 dp[i,j] = p1*dp[i,j] + p2*dp[i+1,j] + p3*dp[i,j+1] + p4*dp[i+1,j+1] + 1; 24 整理得: 25 dp[i,j] = ( 1 + p2*dp[i+1,j] + p3*dp[i,j+1] + p4*dp[i+1,j+1] )/( 1-p1 ) 26 = ( n*s + (n-i)*j*dp[i+1,j] + i*(s-j)*dp[i,j+1] + (n-i)*(s-j)*dp[i+1,j+1] )/( n*s - i*j ) 27 **/ 28 #include <cstdio> 29 #include <iostream> 30 31 using namespace std; 32 33 double dp[1005][1005]; 34 35 int main() 36 { 37 int n, s, ns; 38 39 cin >> n >> s; 40 ns = n*s; 41 dp[n][s] = 0.0; 42 for (int i = n; i >= 0; i--) 43 for (int j = s; j >= 0; j--) 44 { 45 if ( i == n && j == s ) continue; 46 dp[i][j] = ( ns + (n-i)*j*dp[i+1][j] + i*(s-j)*dp[i][j+1] + (n-i)*(s-j)*dp[i+1][j+1] )/( ns - i*j ); 47 } 48 printf("%.4lf\n", dp[0][0]); 49 50 return 0; 51 }