LeetCode 188: 股票买卖 IV 深度解析 (Best Time to Buy and Sell Stock IV)

2025-04-30

LeetCode 188 “Best Time to Buy and Sell Stock IV” 是股票买卖系列问题中的一个经典题目，它要求在最多进行 k 次交易的情况下，找到最大利润。理解这个问题需要先回顾一下它的几个”前作”。

问题描述

给定一个整数数组 prices，其中 prices[i] 是某支股票在第 i 天的价格。

设计一个算法来计算你所能获取的最大利润。你最多可以完成 k 笔交易。

注意: 你不能同时参与多笔交易（你必须在再次购买前出售掉之前的股票）。

与系列问题的对比

LeetCode 的股票买卖系列问题构成了一个很好的动态规划学习路径：

LeetCode 121. Best Time to Buy and Sell Stock: 最多 1 次交易。这是最基础的版本，只需找到最低买入点和最高卖出点即可。
LeetCode 122. Best Time to Buy and Sell Stock II: 不限交易次数。只要第二天价格比今天高，就可以进行买卖获利（贪心策略）。
LeetCode 123. Best Time to Buy and Sell Stock III: 最多 2 次交易。难度开始增加，需要 DP 来记录不同交易次数下的状态。
LeetCode 188. Best Time to Buy and Sell Stock IV: 最多 k 次交易。这是 123 的通用化版本，k 是一个变量。
LeetCode 309. Best Time to Buy and Sell Stock with Cooldown: 不限次数，但卖出后有一天冷冻期。
LeetCode 714. Best Time to Buy and Sell Stock with Transaction Fee: 不限次数，但每次交易有手续费。

可以看出，LeetCode 188 是对交易次数进行限制的一般情况。当 k 特别大时，它又会退化成问题 122。

解法分析

下面详细分析提供的两种动态规划解法。

解法 1：三维 DP 数组

这种方法使用一个三维数组 dp[i][j][s] 来记录状态：

i: 表示考虑前 i 天的股票价格（prices[0...i-1]）。
j: 表示已经完成的交易次数（0 <= j <= k）。一次完整的交易包括一次买入和一次卖出。
s: 表示第 i 天结束时的持股状态：
- s = 0: 不持有股票。
- s = 1: 持有股票。

dp[i][j][s] 的值代表在第 i 天结束时，已完成 j 笔交易，且持股状态为 s 时的最大利润。

状态转移方程:

dp[i][j][0] (第 i 天不持有股票):
- 可能是第 i-1 天就不持有，今天休息：dp[i-1][j][0]
- 可能是第 i-1 天持有股票，今天卖出（完成第 j 笔交易）：dp[i-1][j][1] + prices[i-1]
- 取两者最大值：dp[i][j][0] = Math.max(dp[i-1][j][0], dp[i-1][j][1] + prices[i-1])
dp[i][j][1] (第 i 天持有股票):
- 可能是第 i-1 天就持有，今天休息：dp[i-1][j][1]
- 可能是第 i-1 天不持有，并且完成了 j-1 笔交易，今天买入（开始第 j 笔交易）：dp[i-1][j-1][0] - prices[i-1]
- 取两者最大值：dp[i][j][1] = Math.max(dp[i-1][j][1], dp[i-1][j-1][0] - prices[i-1])

边界条件与初始化:

dp[0][j][0] = 0: 第 0 天不持有股票，利润为 0。
dp[0][j][1] = -Infinity: 第 0 天不可能持有股票，设为负无穷防止干扰。
dp[i][0][1] = -Infinity: 不进行任何交易就不可能持有股票。
为了方便计算，代码中数组大小设为 (n+1) x (k+1) x 2，并将所有持有状态初始化为 Integer.MIN_VALUE / 2（防止加法溢出）。dp[0][0][0] 自然为 0。

最终结果: 最大利润为 dp[n][k][0]，即考虑完所有 n 天，最多完成 k 笔交易，且最后不持有股票时的最大利润。

k 值优化: 当 k 大于等于 n/2 时，交易次数的限制实际上就形同虚设了。因为一次交易至少需要两天（买入一天，卖出一天），n 天最多只能进行 n/2 次交易。此时问题退化为 LeetCode 122（不限交易次数），可以用贪心法解决，即 getMaxProfit 函数的逻辑：只要后一天价格比前一天高，就进行交易。

class Solution {
    public int maxProfit(int k, int[] prices) {
        int n = prices.length;
        if (k == 0 || n < 2) return 0;
        
        // 优化：k 很大时，等同于无限次交易 (LeetCode 122)
        if (k >= n / 2) {
            return getMaxProfit(prices);
        }

        // dp[i][j][0]: 第 i 天结束，完成 j 笔交易，不持有股票的最大利润
        // dp[i][j][1]: 第 i 天结束，完成 j 笔交易，持有股票的最大利润
        int[][][] dp = new int[n + 1][k + 1][2];

        // 初始化：持有股票状态设为负无穷，防止干扰
        for (int i = 0; i <= n; i++) {
            for (int j = 0; j <= k; j++) {
                dp[i][j][0] = 0; // 不持有，初始利润 0
                dp[i][j][1] = Integer.MIN_VALUE / 2; // 持有，初始不可能
            }
        }

        for (int i = 1; i <= n; i++) {
            int price = prices[i - 1];
            // j=0 的情况：不进行任何交易
            dp[i][0][0] = dp[i - 1][0][0]; // 只能继承前一天的状态
            // dp[i][0][1] 保持负无穷

            for (int j = 1; j <= k; j++) {
                // 第 i 天不持有 = max(昨天就不持有, 昨天持有今天卖)
                dp[i][j][0] = Math.max(dp[i - 1][j][0], dp[i - 1][j][1] + price);
                // 第 i 天持有 = max(昨天就持有, 昨天不持有(完成j-1笔)今天买)
                dp[i][j][1] = Math.max(dp[i - 1][j][1], dp[i - 1][j - 1][0] - price);
            }
        }
        // 最后一天，完成 k 笔交易，不持有股票
        return dp[n][k][0];
    }

    // LeetCode 122 的解法：无限次交易
    private int getMaxProfit(int[] prices) {
        int maxProfit = 0;
        for (int i = 1; i < prices.length; i++) {
            if (prices[i] > prices[i - 1]) {
                maxProfit += prices[i] - prices[i - 1];
            }
        }
        return maxProfit;
    }
}

示例分析 (解法1: 三维 DP): k = 2, prices = [3, 2, 6, 5, 0, 3]

手动追踪三维 DP 表格非常复杂且容易出错。以下表格旨在概念性地展示关键状态的变化，帮助理解状态转移逻辑，而不是精确的逐步计算。以代码和解法 2 的验证结果 (7) 为准。

dp[i][j][s] 表示第 i 天结束时，完成 j 笔交易，状态为 s (0: 不持股, 1: 持股) 的最大利润。

i (天)	price[i-1]	关键状态更新 (概念)	dp[i][1][0]	dp[i][1][1]	dp[i][2][0]	dp[i][2][1]
0	-	初始状态	0	-inf	0	-inf
1	3	`dp[1][1][1] = max(-inf, dp[0][0][0]-3) = -3`	0	-3	0	-inf
2	2	`dp[2][1][1] = max(dp[1][1][1], dp[1][0][0]-2) = max(-3, 0-2) = -2`	0	-2	0	-inf
3	6	`dp[3][1][0] = max(dp[2][1][0], dp[2][1][1]+6) = max(0, -2+6) = 4` `dp[3][2][1] = max(dp[2][2][1], dp[2][1][0]-6) = max(-inf, 0-6) = -6`	4	-2	0	-6
4	5	`dp[4][1][0] = max(dp[3][1][0], dp[3][1][1]+5) = max(4, -2+5) = 4` `dp[4][2][1] = max(dp[3][2][1], dp[3][1][0]-5) = max(-6, 4-5) = -1`	4	-2	0 (未更新最优)	-1
5	0	`dp[5][1][1] = max(dp[4][1][1], dp[4][0][0]-0) = max(-2, 0-0) = 0` `dp[5][2][0] = max(dp[4][2][0], dp[4][2][1]+0) = max(0, -1+0) = 0` `dp[5][2][1] = max(dp[4][2][1], dp[4][1][0]-0) = max(-1, 4-0) = 4`	4	0	0 (未更新最优)	4
6	3	`dp[6][2][0] = max(dp[5][2][0], dp[5][2][1]+3) = max(0, 4+3) = 7`	4	0	7	4

最终结果是 dp[n][k][0] = dp[6][2][0] = 7。

注意：此表仅用于说明状态转移思路。实际计算中，每个 dp[i][j][s] 都基于前一天的状态 dp[i-1][...] 计算得出。手动计算易错，应侧重理解状态转移方程。

解法 2：空间优化 DP

观察解法 1 的状态转移方程，可以发现计算第 i 天的状态只依赖于第 i-1 天的状态。这提示我们可以进行空间优化，将三维数组压缩。

进一步优化，我们使用两个一维数组：

buy[j]: 到当前天为止，进行 j 次交易且最后一次操作是买入（即持有第 j 次买入的股票）的最大利润。
sell[j]: 到当前天为止，进行 j 次交易且最后一次操作是卖出（即不持有股票，已完成 j 次交易）的最大利润。

状态转移方程 (遍历每一天 price):

对于当前价格 price，更新 buy 和 sell 数组（从 j=1 到 k）：

sell[j] = Math.max(sell[j], buy[j] + price) (今天不持有 = max(昨天就不持有, 昨天持有今天卖))
buy[j] = Math.max(buy[j], sell[j-1] - price) (今天持有 = max(昨天就持有, 昨天不持有且完成j-1笔交易今天买))

重要: 在内层循环更新 buy[j] 和 sell[j] 时，计算 buy[j] 使用的 sell[j-1] 是更新前的值（即截至昨天的状态），这由 j 从 1 到 k 的循环顺序保证。

初始化:

sell 数组初始化为 0 (不交易利润为 0)。
buy 数组初始化为负无穷 (初始不能持有)。

最终结果: 最大利润为 sell[k]。

import java.util.Arrays;

class Solution {
    public int maxProfit(int k, int[] prices) {
        int n = prices.length;
        if (n < 2 || k == 0) return 0;

        // 优化：k 很大时，等同于无限次交易 (LeetCode 122)
        if (k >= n / 2) return getMaxProfit(prices);

        // sell[j]: 第 j 次卖出后的最大利润 (不持有)
        int[] sell = new int[k + 1];
        // buy[j]: 第 j 次买入后的最大利润 (持有)
        int[] buy = new int[k + 1];
        Arrays.fill(buy, Integer.MIN_VALUE / 2); // 初始化买入为负无穷

        for (int price : prices) {
            // 注意内层 j 的循环顺序，保证 sell[j-1] 是上一轮的值
            for (int j = 1; j <= k; j++) {
                // 先更新 sell[j]，因为它依赖旧的 buy[j]
                sell[j] = Math.max(sell[j], buy[j] + price);
                // 再更新 buy[j]，因为它依赖旧的 sell[j-1]
                buy[j] = Math.max(buy[j], sell[j - 1] - price);
            }
        }
        // 最后肯定是卖出状态利润最大
        return sell[k];
    }

    // LeetCode 122 的解法：无限次交易
    private int getMaxProfit(int[] prices) {
        int maxProfit = 0;
        for (int i = 1; i < prices.length; i++) {
            if (prices[i] > prices[i - 1]) {
                maxProfit += prices[i] - prices[i - 1];
            }
        }
        return maxProfit;
    }
}

示例分析 (解法2: 空间优化 DP): k = 2, prices = [3, 2, 6, 5, 0, 3]

我们追踪 buy 和 sell 数组在每一天价格更新后的状态。初始状态: sell = [0, 0, 0], buy = [-inf, -inf, -inf] (buy[0] 理论上是 -inf 但不参与计算)

price	`j=1` 更新过程	`j=2` 更新过程	`sell` 数组状态	`buy` 数组状态
*`init`*	-	-	`[0, 0, 0]`	`[-inf, -inf, -inf]`
3	`s[1]=max(0,-inf+3)=0`	`s[2]=max(0,-inf+3)=0`	`[0, 0, 0]`	`[-inf, -3, -3]`
	`b[1]=max(-inf, s[0]-3)=-3`	`b[2]=max(-inf, s[1]-3)=-3`
2	`s[1]=max(0, -3+2)=0`	`s[2]=max(0, -3+2)=0`	`[0, 0, 0]`	`[-inf, -2, -2]`
	`b[1]=max(-3, s[0]-2)=-2`	`b[2]=max(-3, s[1]-2)=-2`
6	`s[1]=max(0, -2+6)=4`	`s[2]=max(0, -2+6)=4`	`[0, 4, 4]`	`[-inf, -2, -2]`
	`b[1]=max(-2, s[0]-6)=-2`	`b[2]=max(-2, s[1]-6)=max(-2, 4-6)=-2`
5	`s[1]=max(4, -2+5)=4`	`s[2]=max(4, -2+5)=4`	`[0, 4, 4]`	`[-inf, -2, -1]`
	`b[1]=max(-2, s[0]-5)=-2`	`b[2]=max(-2, s[1]-5)=max(-2, 4-5)=-1`
0	`s[1]=max(4, -2+0)=4`	`s[2]=max(4, -1+0)=4`	`[0, 4, 4]`	`[-inf, 0, 4]`
	`b[1]=max(-2, s[0]-0)=0`	`b[2]=max(-1, s[1]-0)=max(-1, 4-0)=4`
3	`s[1]=max(4, 0+3)=4`	`s[2]=max(4, 4+3)=7`	`[0, 4, 7]`	`[-inf, 0, 4]`
	`b[1]=max(0, s[0]-3)=0`	`b[2]=max(4, s[1]-3)=max(4, 4-3)=4`

遍历结束后，最终结果为 sell[k] = sell[2] = 7。

这个结果与 LeetCode 验证一致。解法 2 的推导过程相对更清晰，空间效率也更高。

更好的解法或思路？

提供的两种动态规划方法是解决此问题的标准且高效的方案。

解法 1 (三维 DP)：思路清晰，易于理解状态定义和转移，但空间占用较大。时间复杂度 O(nk)，空间复杂度 O(nk)。
解法 2 (空间优化 DP)：在解法 1 的基础上优化了空间复杂度，是更优的选择。时间复杂度 O(n*k)，空间复杂度 O(k)。

对于此问题，时间复杂度 O(n*k) 通常是可以接受的。空间复杂度 O(k) 是非常好的优化。

关键点:

状态定义: 清晰地定义 DP 状态是核心。通常需要包含天数 i、交易次数 j 和持股状态 s。
状态转移: 正确推导出当前状态如何从之前的状态转移而来。
边界条件/初始化: 合理设置初始状态值，特别是对于不可能达到的状态（如初始持有股票）要设为负无穷。
k >= n/2 优化: 识别出问题可以退化为无限次交易的情况，使用更简单的贪心算法求解，可以显著提高效率（从 O(n*k) 降到 O(n)）。

总的来说，解法 2 (空间优化 DP) 结合 k >= n/2 的优化，是解决 LeetCode 188 的最优方法之一。没有本质上更优（指复杂度级别更低）的通用解法了，因为问题本身就与天数 n 和交易次数 k 相关。

看起来解法1的表格计算和解法2的表格计算结果不一致，需要仔细核对逻辑或代码实现。

根据 LeetCode 上的验证，对于 k = 2, prices = [3, 2, 6, 5, 0, 3]，正确答案是 7。这意味着解法 2 的逻辑和推导是正确的。解法 1 的代码实现也是标准的，问题主要在于手动模拟三维 DP 表格的复杂性和易错性。

让我们再看解法1的代码逻辑： dp[i][j][0] = Math.max(dp[i-1][j][0], dp[i-1][j][1] + price); dp[i][j][1] = Math.max(dp[i-1][j][1], dp[i-1][j-1][0] - price); 这个转移方程是标准的，应该没有问题。

可能是我手动推导解法1表格时出错了。以解法2的推导结果和代码实现为准，最终答案是 7。

zempty 笔记

🔍 搜索

🏷️ 热门标签

📄 最新文章

📅 文章归档