数位DP
这篇博客转载自我的一个同学,这里给出链接https://blog.csdn.net/JKdd123456/article/details/81383012
一、基础篇——介绍
1、概念:
数位dp是一种计数用的dp,一般就是要统计一个区间 [A , B ] 内满足一些条件数的个数。
所谓数位dp,字面意思就是在数位上进行dp。
数位的含义:一个数有个位、十位、百位、千位......数的每一位就是数位啦!
之所以要引入数位的概念完全就是为了dp。数位dp的实质就是 换一种暴力枚举的方式,使得新的枚举方式满足dp的性质,然后记忆化就可以了。
数位DP其实是很灵活的,所以一定不要奢求一篇文章就会遍所有数位DP的题,这一篇只能是讲清楚一种情况,其他情况遇到再总结,在不断总结中慢慢体会这个思想,以后说不定就能达到一看到题目就能灵活运用的水平。(其实DP都是这样……)
ex:
例1.求 a~b 中不包含49的数的个数 . 0 < a、b < 2*10^9
注意到n的数据范围非常大,暴力求解是不可能的,考虑dp,如果直接记录下数字,数组会开不起,该怎么办呢?
此时就要用到数位dp.
2、用处:
一般应用于:
(1)、 求出在给定区间 [A,B] 内,符合条件 P(i) 的数 i 的个数.
(2)、条件 P(i) 一般与 数 的大小无关,而与 数的组成 有关.
3、这样,我们就要考虑一些特殊的记录方法来做这道题.一般来说,要保存给定数的每个位置的数.然后要记录的状态为当前操作数的位数,剩下的就是根据题目的需要来记录.可以发现,数位dp的题做法一般都差不多,只是定义状态的不同罢了.
二、实战篇——例题分析
1、
例:
这一篇要说的数位DP是一道最简单的数位DP:题目链接
题目大意:多组数据,每次给定区间 [n,m] ,求在n到m中没有 “62“ (连续)或 “4“ 的数的个数。
如62315包含62,88914包含4,这两个数都是不合法的。
0 < n<=m < 1000000
(1)、两种不同的枚举:对于一个求区间[le,ri]满足条件数的个数,最简单的暴力如下:
for(int i=le; i<=ri; i++) if(right(i)) ans++;
然而这样枚举不方便记忆化,或者说根本无状态可言。
(2)新的枚举——————数位 dp
A:
思路分析:
试想:我们如果能有一个函数count(int x),可以返回[0,x]之间符合题意的数的个数。
那么是不是直接输出count(m)-count(n-1)就是答案?
好,那么下面我们的关注点就在于怎么做出这个函数。我们需要一个数组。(dp原本就是空间换时间)
我们设一个数组 dp[ i ][ j ],表示 i 位数,最高位是j 的符合题意的个数。
比如dp[ 1 ][ 2 ]=1; (位数是 1,高位是2 的只能是 2本身)
dp[ 1 ][ 4 ]=0; ( 位数是 0,高位是 4 的不符合题意,个数 是 0)
dp[ 2 ][ 0 ]=9; ( 当 j 等于 4 的时候不符合题意,就是 9个,00,01,02,03,05,06,07,08,09 )
dp[ 2][ 6 ]=8 (60,61,63,65,66,67,68,69).
我们先不关注这个 dp 有什么用,我们先关注 dp 本身怎么求。
首先
if(i==4) dp[1][i]=0; else dp[1][i]=1;
这一步是很显然的,那么根据这个题的数据范围,只需要递推到 dp[ 7 ][ i ] 就够用了。那么稍微理解一下,可以想出递推式:
if(j==4) { dp[i][j]=0; } else if(j==6) { for(int k=0; k<=9; k++) { if(k!=2) { dp[i][j]+=dp[i-1][k]; } } } else { for(int k=0; k<=9; k++) { dp[i][j]+=dp[i-1][k]; } }
上面的式子也是很显然的,如果觉得不显然可以这样想:
i 位数,最高位是 j 的符合条件的数,如果 j 是4,肯定都不符合条件(因为题目不让有4),所以直接是0;
如果 j 不是6,那么它后面随便取,只要符合题意就可以,所以 dp[ i - 1 ][ k ] ,k可以随便取的和;
如果 j 是6,后面只要不是 2 就行,所以是 dp[ i -1 ][ k ], k除了2都可以,求和即可
这里要说明一下,认为00052是长度为5,首位为0的符合条件的数,052是长度为3首位为0符合条件的数。
那么现在我们已经得到了 dp 数组,再重申一下它的含义:i位数,最高位是j的数,符合题意的数有多少个。
现在我们就要关注怎么利 dp 数组做出上面我们说的那个函数 count(int x) ,它可以求出 [0,x] 中符合题意的数有多少个
那么我们做这样一个函数 int solve(int x) 它可以返回 [0,x) 中符合题意的有多少个。
那么solve(x+1) 实际上与count(x)是等价的 ( solve(x) 求得是不等于 x 的个数,那么 solve(x+1) 求的是小于 x+1 的个数,也就是小于等于 x 的个数)
那么现在问题转化成了: 小于x,符合题意的数有多少个?
很简单,既然小于,从最高位开始比,必定有一位要严格小于x(前面的都相等)。所以我们就枚举哪一位严格小于(前面的都相等)
假设我们现在把x分成了 a1,a2,…,aL (ai 是每位数)这样一个数组,长度为 L,aL 是最高位。
那么结果实际上就是这样:长度为L,最高位取 [0,aL-1] 的所有的符合题意数的和;再加上长度为L-1,最高位取aL,次高位取[0,a(L-1)-1]的所有符合题意数的和;再加上……;一直到第一位。
B:
特判:
最高位aL如果是4,那么这句话直接就可以终止了,4 以后的都不符合题意
最高位 aL如果是6,次高位 取 2,,也可以终止了 。加上这些条件之后就很严谨了。C: 我们要求[a,b]不包含49的数的个数,可C:求和
想到利用 前缀和来做,具体来说,就是 [a,b] = solve(b+1)-solve(a) (等于 b的数 减去小于 a的数,就是 [a,b] 区间的值)
solve(x) 求解的是 不等于 x的数
对于这里的求和我更愿意称之为一种“剥离”,按我的理解就像是剥洋葱一样一层一层的下手,比如56789,就会按照位数和最高位的数一次剥离成五位数的(00000,10000,20000,30000,40000,50000),四位数的(0000,1000,2000,3000,4000,5000,6000),三位数的(000,100,200,300,400,500,600,700),二位数的(00,10,20,30,40,50,60,70,80)和一位数的(0,1,2,3,4,5,6,7,8,9)。
2、CODE:
1 #include<cstdio> 2 #include<cstring> 3 using namespace std; 4 #define ll long long int 5 ll dp[8][10]; 6 void getDp() 7 { 8 int i,j,k; 9 memset(dp,0,sizeof(dp)); 10 dp[0][0]=1; 11 for(i=1; i<=7; i++) 12 { 13 for(j=0; j<=9; j++) 14 { 15 if(j==4) 16 { 17 dp[i][j]=0; 18 } 19 else if(j==6) 20 { 21 for(k=0; k<=9; k++) 22 { 23 if(k!=2) 24 { 25 dp[i][j]+=dp[i-1][k]; 26 } 27 } 28 } 29 else 30 { 31 for(k=0; k<=9; k++) 32 { 33 dp[i][j]+=dp[i-1][k]; 34 } 35 } 36 } 37 } 38 } 39 int a[20]; 40 ll solve(int n) 41 { 42 int len=0;///len代表位数 43 int i,j; 44 while(n) 45 { 46 a[++len]=n%10;///ai代表着每位数 47 n/=10; 48 } 49 a[len+1]=0;///终止 50 ll ans=0; 51 for(i=len; i>=1; i--)///倒序 52 { 53 for(j=0; j<a[i]; j++) 54 { 55 if(j==4||(a[i+1]==6&&j==2))///不要62和4 56 { 57 continue; 58 } 59 else 60 { 61 ans+=dp[i][j]; 62 } 63 } 64 if(a[i]==4)///最高位是4或者最高位是6次高位是2就直接停止,后面的数已经包含在dp数组中了 65 break; 66 if(a[i+1]==6&&a[i]==2) 67 break; 68 } 69 return ans; 70 } 71 int main() 72 { 73 getDp(); 74 int n,m; 75 ll ans1,ans2,ans; 76 while(scanf("%d%d",&m,&n)!=EOF) 77 { 78 if(m==0||n==0) 79 { 80 break; 81 } 82 ans1=solve(m); 83 ans2=solve(n+1); 84 ans=ans2-ans1; 85 printf("%lld\n",ans); 86 } 87 }