动态规划:股票系列
121. 买卖股票的最佳时机
思路
贪心
因为股票就买卖一次,那么贪心自然就是取最左最小值,取最右最大值,那么得到的差值就是最大利润。
动态规划
-
确定dp数组(dp table)以及下标的含义
dp[i][0] 表示第i天持有股票所得现金(一开始现金是0,那么加入第i天买入股票现金就是 -prices[i], 这是一个负数)。
dp[i][1] 表示第i天不持有股票所得现金
注意这里说的是“持有”,“持有”不代表就是当天“买入”!也有可能是昨天就买入了,今天保持持有的状态 -
确定递推公式
如果第i天持有股票即dp[i][0], 那么可以由两个状态推出来:第i-1天就持有股票,那么就保持现状;第i天买入股票。那么dp[i][0]应该选所得现金最大的,所以dp[i][0] = max(dp[i - 1][0], -prices[i]);
如果第i天不持有股票即dp[i][1], 也可以由两个状态推出来:第i-1天就不持有股票,那么就保持现状;第i天卖出股票。同样dp[i][1]取最大的,dp[i][1] = max(dp[i - 1][1], prices[i] + dp[i - 1][0]); -
dp数组如何初始化
dp[0][0]表示第0天持有股票,此时的持有股票就一定是买入股票了,所以dp[0][0] -= prices[0];
dp[0][1]表示第0天不持有股票,不持有股票那么现金就是0,所以dp[0][1] = 0; -
确定遍历顺序
从递推公式可以看出dp[i]都是有dp[i - 1]推导出来的,那么一定是从前向后遍历。
代码
贪心:
class Solution {
public int maxProfit(int[] prices) {
int ans = 0;
int low = Integer.MAX_VALUE;
for(int i=0;i<prices.length;i++){
low = Math.min(low,prices[i]);
ans = Math.max(ans,prices[i]-low);
}
return ans;
}
}
动态规划:
class Solution {
public int maxProfit(int[] prices) {
int[][] dp = new int[prices.length][2];
//第0天持有股票
dp[0][0] = -prices[0];
//第0天不持有股票
dp[0][1] = 0;
for(int i=1;i<prices.length;i++){
dp[i][0] = Math.max(dp[i-1][0],-prices[i]);
dp[i][1] = Math.max(dp[i-1][1],prices[i]+dp[i-1][0]);
}
return dp[prices.length-1][1];
}
}
122. 买卖股票的最佳时机 II
思路
本题和121. 买卖股票的最佳时机
唯一不同的地方,就是推导dp[i][0]的时候,第i天买入股票的情况。
dp数组的含义:
- dp[i][0] 表示第i天持有股票所得现金。
- dp[i][1] 表示第i天不持有股票所得最多现金
如果第i天持有股票即dp[i][0], 那么可以由两个状态推出:
- 第i-1天就持有股票,那么就保持现状,所得现金就是昨天持有股票的所得现金 即:dp[i - 1][0]
- 第i天买入股票,所得现金就是昨天不持有股票的所得现金减去 今天的股票价格 即:dp[i - 1][1] - prices[i]
在121. 买卖股票的最佳时机中,因为股票全程只能买卖一次,所以第i天持有股票即dp[i][0]一定就是 -prices[i]。
而本题可以买卖多次,所以当第i天买入股票的时候,所持有的现金可能有之前买卖过的利润,所得现金就是昨天不持有股票的所得现金减去今天的股票价格 即:dp[i - 1][1] - prices[i]。
dp[i][0] = Math.max(dp[i-1][0],dp[i-1][1]-prices[i]);// 和121. 买卖股票的最佳时机唯一不同的地方
代码
class Solution {
public int maxProfit(int[] prices) {
int[][] dp = new int[prices.length][2];
//第0天持有股票
dp[0][0] = -prices[0];
//第0天不持有股票
dp[0][1] = 0;
for(int i=1;i<prices.length;i++){
dp[i][0] = Math.max(dp[i-1][0],dp[i-1][1]-prices[i]);// 和121. 买卖股票的最佳时机唯一不同的地方
dp[i][1] = Math.max(dp[i-1][1],prices[i]+dp[i-1][0]);
}
return dp[prices.length-1][1];
}
}
123. 买卖股票的最佳时机 III
思路
本题关键在于至多买卖两次,这意味着可以买卖一次,可以买卖两次,也可以不买卖。
1.确定dp数组以及下标的含义
一天一共就有五个状态:
0. 没有操作
- 第一次买入
- 第一次卖出
- 第二次买入
- 第二次卖出
dp[i][j]中 i表示第i天,j为 [0 - 4] 五个状态,dp[i][j]表示第i天状态j所剩最大现金。
2.确定递推公式
dp[i][1]表示的是第i天买入股票的状态,并不是说一定要第i天买入股票
达到dp[i][1]状态,有两个具体操作:
- 操作一:第i天买入股票了,那么dp[i][1] = dp[i-1][0] - prices[i]
- 操作二:第i天没有操作,而是沿用前一天买入的状态,即:dp[i][1] = dp[i - 1][1]
最后dp[i][1]一定是选最大的,所以 dp[i][1] = max(dp[i-1][0] - prices[i], dp[i - 1][1]);
同理dp[i][2]也有两个操作:
- 操作一:第i天卖出股票了,那么dp[i][2] = dp[i - 1][1] + prices[i]
- 操作二:第i天没有操作,沿用前一天卖出股票的状态,即:dp[i][2] = dp[i - 1][2]
所以dp[i][2] = max(dp[i - 1][1] + prices[i], dp[i - 1][2])
同理:
dp[i][3] = max(dp[i - 1][3], dp[i - 1][2] - prices[i]);
dp[i][4] = max(dp[i - 1][4], dp[i - 1][3] + prices[i]);
3.dp数组如何初始化
第0天没有操作,这个最容易想到,就是0,即:dp[0][0] = 0;
第0天做第一次买入的操作,dp[0][1] = -prices[0];
第0天做第一次卖出的操作,股票买卖最差情况也就是没有盈利即全程无操作现金为0,所以dp[0][2] = 0;
第0天第二次买入操作,不用管第几次,现在手头上没有现金,只要买入,现金就做相应的减少。所以第二次买入操作,初始化为:dp[0][3] = -prices[0];
同理第二次卖出初始化dp[0][4] = 0;
4.确定遍历顺序
从递归公式看出一定是从前向后遍历,因为dp[i],依靠dp[i - 1]的数值。
5.举例推导dp数组
代码
class Solution {
public int maxProfit(int[] prices) {
if (prices.length == 0) return 0;
int[][] dp = new int[prices.length][5];
dp[0][1] = -prices[0];
dp[0][3] = -prices[0];
for (int i = 1; i < prices.length; i++) {
dp[i][0] = dp[i - 1][0];
dp[i][1] = Math.max(dp[i - 1][1], dp[i - 1][0] - prices[i]);
dp[i][2] = Math.max(dp[i - 1][2], dp[i - 1][1] + prices[i]);
dp[i][3] = Math.max(dp[i - 1][3], dp[i - 1][2] - prices[i]);
dp[i][4] = Math.max(dp[i - 1][4], dp[i - 1][3] + prices[i]);
}
return dp[prices.length - 1][4];
}
}
188. 买卖股票的最佳时机 IV
思路
本题要求至多有k次交易。
1.确定dp数组以及下标的含义
本题依然可以用一个二维dp数组 dp[i][j] :第i天的状态为j,所剩下的最大现金是dp[i][j]
j的状态表示为:
- 0 表示不操作
- 1 第一次买入
- 2 第一次卖出
- 3 第二次买入
- 4 第二次卖出
.- ....
除了0以外,偶数就是卖出,奇数就是买入。题目要求是至多有K笔交易,那么j的范围就定义为 2 * k + 1 。
2.确定递推公式
类比j为偶数是买、奇数是卖的状态。
for (int j = 0; j < 2 * k - 1; j += 2) {
dp[i][j + 1] = Math.max(dp[i - 1][j + 1], dp[i - 1][j] - prices[i]);
dp[i][j + 2] = Math.max(dp[i - 1][j + 2], dp[i - 1][j + 1] + prices[i]);
}
3.dp数组如何初始化
dp[0][0] = 0;
卖出股票最差没有盈利即全程无操作现金为0。
dp[0][j]当j为奇数的时候都初始化为 -prices[0]。
4.确定遍历顺序
从递归公式其实已经可以看出,一定是从前向后遍历。
5.举例推导dp数组
代码
class Solution {
public int maxProfit(int k, int[] prices) {
if (prices.length == 0) return 0;
int[][] dp = new int[prices.length][2*k+1];
for (int j = 1; j < 2 * k; j += 2) {
dp[0][j] = -prices[0];
}
for (int i = 1;i < prices.length; i++) {
for (int j = 0; j < 2 * k - 1; j += 2) {
dp[i][j + 1] = Math.max(dp[i - 1][j + 1], dp[i - 1][j] - prices[i]);
dp[i][j + 2] = Math.max(dp[i - 1][j + 2], dp[i - 1][j + 1] + prices[i]);
}
}
return dp[prices.length - 1][2 * k];
}
}
309. 最佳买卖股票时机含冷冻期
思路
本题需要第三个状态:不持有股票(冷冻期)的最多现金。
确定dp数组以及下标的含义
dp[i][j],第i天状态为j,所剩的最多现金为dp[i][j]。
j的状态为:
- 0:持有股票后的最多现金
- 1:不持有股票(能购买)的最多现金
- 2:不持有股票(冷冻期)的最多现金
确定递推公式
达到持有股票dp[1][0]状态,有两个具体操作:
- 操作一:前一天就是持有股票状态,dp[i][0] = dp[i - 1][0]
- 操作二:今天买入了,dp[i][0] = dp[i - 1][1] - prices[i]
达到不持有股票(能购买)的最多现金dp[i][1] 状态,有两个操作:
- 操作一:前一天卖出了股票在冷冻期,即:dp[i][1] = dp[i - 1][2]
- 操作二:前一天就是不持有股票(能购买)的状态,即:dp[i][1] = dp[i - 1][1]
达到不持有股票(冷冻期)的最多现金dp[i][2]状态,只有一个操作:
- 前一天卖出股票
代码
class Solution {
public int maxProfit(int[] prices) {
int[][] dp = new int[prices.length][3];
//第0天持有股票后的最多现金
dp[0][0] = -prices[0];
//第0天不持有股票(能购买)的最多现金
dp[0][1] = 0;
//第0天不持有股票(冷冻期)的最多现金
dp[0][2] = 0;
for(int i=1;i<prices.length;i++){
dp[i][0] = Math.max(dp[i-1][0],dp[i-1][1]-prices[i]);
dp[i][1] = Math.max(dp[i-1][1],dp[i-1][2]);
dp[i][2] = dp[i-1][0] + prices[i];
}
return Math.max(dp[prices.length-1][1],dp[prices.length-1][2]);
}
}
714. 买卖股票的最佳时机含手续费
思路
相对于 122. 买卖股票的最佳时机 II ,本题只需要在计算卖出操作的时候减去手续费就可以了。
如果第i天不持有股票即dp[i][1]的情况, 可以由两个状态推出:
- 第i-1天就不持有股票,那么就保持现状,所得现金就是昨天不持有股票的所得现金 即:dp[i - 1][1]
- 第i天卖出股票,所得现金就是按照今天股票价格卖出后所得现金,注意这里需要有手续费了即:dp[i - 1][0] + prices[i] - fee
所以:dp[i][1] = max(dp[i - 1][1], dp[i - 1][0] + prices[i] - fee);
代码
class Solution {
public int maxProfit(int[] prices, int fee) {
int[][] dp = new int[prices.length][2];
//第0天持有股票
dp[0][0] = -prices[0];
//第0天不持有股票
dp[0][1] = 0;
for(int i=1;i<prices.length;i++){
dp[i][0] = Math.max(dp[i-1][0],dp[i-1][1]-prices[i]);
dp[i][1] = Math.max(dp[i-1][1],prices[i]+dp[i-1][0]-fee);//有手续费
}
return dp[prices.length-1][1];
}
}