|
8 | 8 | | 2 | 3 | 13 |
|
9 | 9 | | 3 | 4 | 11 |
|
10 | 10 |
|
11 |
| -抢劫犯这次过来光顾珠宝店只带了一个最多只能承重17 kg的粉红色小包,于是问题来了,怎样搭配这些不同重量不同价值的珠宝才能不虚此行呢?哎,这年头抢劫也不容易啊... |
| 11 | +抢劫犯这次过来光顾珠宝店只带了一个最多只能承重 17 kg 的粉红色小包,于是问题来了,怎样搭配这些不同重量不同价值的珠宝才能不虚此行呢?唉,这年头抢劫也不容易啊... |
12 | 12 |
|
13 | 13 | 用数学语言来描述这个问题就是:
|
14 |
| -背包最多只能承重 $$W$$ kg, 有 $$n$$ 种珠宝可供选择,这 $$n$$ 种珠宝的重量分别为 $$\omega_1,\cdots,\omega_n$$, 相应的价值为 $$v_1,\cdots,v_n$$. 问如何选择这些珠宝使得放进包里的珠宝价值最大化? |
15 | 14 |
|
16 |
| -## Knapsack with repetition - 物品重复可用的背包问题 |
| 15 | +背包最多只能承重 $$W$$ kg, 有 $$n$$ 种珠宝可供选择,这 $$n$$ 种珠宝的重量分别为 $$w_1,\cdots,w_n$$, 相应的价值为 $$v_1,\cdots,v_n$$. 问如何选择这些珠宝使得放进包里的珠宝价值最大化? |
| 16 | + |
| 17 | +现实场景中,我们遇到的问题往往是重量或者珠宝数有限,对于这 n 种珠宝,只有两种情况——要么取,要么不取,这也被称为著名的 01 背包问题;而同一种珠宝如果可以取无限多次,则对应完全背包问题。 |
17 | 18 |
|
18 |
| -由于这类背包问题中,同一物品可以被多次选择,因此称为Knapsack with repetition, 又称Unbounded knapsack problem(无界背包问题). |
| 19 | +## Knapsack without repetition - 01 背包问题 |
19 | 20 |
|
20 |
| -动态规划是解决背包问题的有力武器,而在动态规划中,主要的问题之一就是——状态(子问题)是什么?在本题中我们可以从两个方面对原始问题进行化大为小:要么是是更小的背包容量 $$\omega \leq W$$, 要么尝试更少的珠宝数目(如珠宝 $$1, 2, \cdots , j, ~for~ j \leq n$$). 这两个状态(子问题)究竟哪个对于解题更为方便,还需进一步论证——能否根据状态(子问题)很方便地写出状态转移方程。 |
| 21 | +我们先来处理一种珠宝最多只能带走一件这种情形下,抢劫犯该如何做才能使得背包中的珠宝价值总价最大?最为简单粗暴的方法自然是把这 n 种珠宝挨个试一遍,总共可能的组合数之和为 $$C_n^0 + \cdots + C_n^n = 2^n$$, 这种指数级别的时间复杂度显然是不能忍的,在搜索的过程中我们可以发现中间的一些子状态是可以避免重复计算的,下面我们使用动态规划的思路去进一步分析 01 背包问题。 |
21 | 22 |
|
22 |
| -先来看看第一种状态:**在背包容量为 $$\omega$$ 时抢劫犯所能获得的最优值为 $$K(\omega)$$.** 对应此状态的状态转移方程并不是那么直观,先从 $$K(\omega)$$ 所包含的信息出发,$$K(\omega) > 0$$ 时,背包中必然含有某件值钱的珠宝,不妨假设最优值 $$K(\omega)$$ 包含某珠宝 $$i$$, 那么将珠宝 $$i$$ 从背包中移除后,背包中剩余珠宝的价值加上珠宝 $$i$$ 的价值即为 $$K(\omega)$$. 哪尼?这不就是个天然的状态转移方程么?抢劫犯灵机一动,立马想出了如下状态转移方程: |
23 |
| -$$K(\omega) = F(\omega - \omega_i) + v_i ~(\omega_i \in \Omega)$$ |
| 23 | +在动态规划中,主要的问题之一就是——状态(子问题)是什么?在本题中我们可以从两个方面对原始问题进行化大为小:要么尝试更小的背包容量 $$w \leq W$$, 要么尝试更少的珠宝数目 $$j \leq n$$. 由于涉及到两个自变量,考虑到按顺序挑选珠宝这一过程更容易理解,我们不难定义状态 $$K(i, w)$$ 为挑选出前 i 件珠宝时,重量不超过 w 时的珠宝总价值的最大值。相应的状态转移方程为第 i 件珠宝要么不选,要么选,即 $$K(i,w) = \max \{K(i-1, w), K(i-1, w- w_i) + v_i\}$$. 令 `dp[i + 1][j]` 表示从前 i 种物品中选出总重量不超过 j 时珠宝总价值的最大值。那么有转移方程: |
24 | 24 |
|
25 |
| -其中 $$F(\omega - \omega_i)$$ 为拿出珠宝 $$i$$ 后的价值映射函数(用人话来说就是把粉红色小包里剩下的珠宝价值加起来),取出来的珠宝重量 $$\omega_i < \omega$$(总不能取出大于背包重量的珠宝吧...), $$\Omega$$ 即为 $$K(\omega)$$ 中 $$\omega_i$$ 的所有可能取值。想了想好像哪里不对劲,$$K(\omega)$$ 的转移关系没鼓捣出来,反而新添了个 $$F(\omega - \omega_i)$$, 真是旧爱未了又添新欢... 别急,再仔细瞅瞅以上等式两端,拿出珠宝 $$i$$ 后,其价值 $$v_i$$ 就可以认为是一个定值了,故要想 $$K(\omega)$$ 为最大值,$$F(\omega - \omega_i)$$ 也理应是背包容量为 $$\omega - \omega_i$$ 时的包内珠宝的最大价值,如若不是,则必然存在 $$F(\omega - \omega_i) < K(\omega - \omega_i)$$, 即有 |
26 |
| -$$K(\omega) = F(\omega - \omega_i) + v_i < K(\omega - \omega_i) + v_i = K^{\prime}(\omega)$$ |
27 |
| -与 $$K(\omega)$$ 为在背包容量为 $$\omega$$ 时的最大值的定义不符,故假设不成立,$$F(\omega - \omega_i) = K(\omega - \omega_i)$$. 千斤顶终于成功上位——变成了备胎... 新的状态转移方程可改写为: |
28 |
| -$$K(\omega) = K(\omega - \omega_i) + v_i$$ |
| 25 | +``` |
| 26 | +dp[i + 1][j] = max{dp[i][j], dp[i][j - w[i]] + v[i]} |
| 27 | +``` |
29 | 28 |
|
30 |
| -嗯,好像还是有哪里不对劲,千斤顶虽然已晋级为备胎,可备胎这个身份实在是不怎么好听,这不还有下标 $$i$$ 这个标记嘛,我们给抢劫犯想想法子,怎么才能让备胎尽快转正呢?!仔细分析发现我们刚才取出d的价值 $$v_i$$ 是从已知背包容量为 $$\omega$$ 时取出来的珠宝 $$i$$, 重量为 $$\omega_i$$. 那么到底那几个珠宝才是可能被取出来的呢?答案不得而知,只知道肯定是小于背包容量 $$\omega$$ 中的某一个。既然是这样,我们把所有小于背包容量 $$\omega$$ 的珠宝挨个拿出来比一比不就完了么?但这样一来又有了新的问题:取出来的珠宝 $$\omega_i$$ 不一定是最大值 $$K(\omega)$$中所包含的珠宝,那假如我们一定要拿出来比一比呢?得到的结果自然是不大于最大值 $$K(\omega)$$(如果不是,反证法证之), 用数学语言表示就是: |
31 |
| -$$K(\omega) \geq K(\omega - \omega_j) + v_j ~(\omega_j \notin \Omega)$$ |
| 29 | +时间复杂度为 $$(O(nW))$$. |
| 30 | + |
| 31 | +这里的分析是以容量递推的,但是在容量特别大时,可以看出时间复杂度略高,这时我们可能需要以价值作为转移方程。定义状态 `dp[i + 1][j]` 为前 i 个物品中挑选出价值总和为 j 时总重量的最小值(所以对于不满足条件的索引应该用充分大的值而不是最大值替代,防止溢出)。相应的状态转移方程相思:即第 i 件珠宝选中与否,即 `dp[i + 1][j] = min{dp[i][j], dp[i][j - v[i]] + w[i]}`. 最终返回结果为 `dp[n][j] ≤ W` 中最大的 j. |
| 32 | + |
| 33 | +## Knapsack with repetition - 物品重复可用的背包问题 |
32 | 34 |
|
33 |
| -整理一下思路,用优雅的数学语言来表示就是: |
34 |
| -$$K(\omega) = \max_{i:~\omega_i \leq \omega} \{K(\omega - \omega_i) + v_i\}$$ |
| 35 | +相比于 01 背包问题,这类背包问题中同一物品可以被多次选择,因此称为 Knapsack with repetition, 又称 Unbounded knapsack problem(无界背包问题). 由 01 背包问题扩展后状态定义仍然可以不变,但状态变化则由原来的第 i 件珠宝选或者不选改为选不小于 0 任何整数件。 |
35 | 36 |
|
36 |
| -备胎终于得以登堂入室,警察叔叔,就是她了... 状态转移方程终于完整的找到了,千斤顶窃喜道:皇天不负有心人,我也有转正的一天,蛤蛤蛤... |
| 37 | +令 `dp[i + 1][j]` 表示从前 i 种物品中选出总重量不超过 j 时珠宝总价值的最大值。那么有转移方程: |
37 | 38 |
|
38 |
| -令`dp[i + 1][j]`表示从前`i`种物品中选出总重量不超过`j`时总价值的最大值。那么有转移方程: |
39 | 39 | ```
|
40 | 40 | dp[i + 1][j] = max{dp[i][j - k × w[i]] + k × v[i] | 0 ≤ k}
|
41 | 41 | ```
|
42 |
| -最坏情况下时间复杂度为 $$O(kW^2)$$. 对上式进一步变形可得: |
| 42 | + |
| 43 | +最坏情况下时间复杂度为 $$O(kW^2)$$. 我们对上式进一步变形可得: |
| 44 | + |
43 | 45 | ```
|
44 | 46 | dp[i + 1][j] = max{dp[i][j - k × w[i]] + k × v[i] | 0 ≤ k}
|
45 | 47 | = max{dp[i][j], max{dp[i][j - k × w[i]] + k × v[i] | 1 ≤ k}}
|
46 | 48 | = max{dp[i][j], max{dp[i][(j - w[i]) - k × w[i]] + k × v[i] | 0 ≤ k} + v[i]}
|
47 |
| - = max{dp[i][j], dp[i + 1][j - w[i]] + v[j]} |
| 49 | + = max{dp[i][j], dp[i + 1][j - w[i]] + v[i]} |
48 | 50 | ```
|
49 | 51 |
|
50 |
| -**注意等式最后一行,咋看和01背包一样,实际上区别在于`dp[i + 1][]`, 01背包中为`dp[i][]`.** 此时时间复杂度简化为 $$O(nW)$$. |
51 |
| - |
52 |
| -## Knapsack without repetition - 01背包问题 |
53 |
| - |
54 |
| -上节讲述的是最原始的背包问题,这节我们探讨条件受限情况下的背包问题。若一件珠宝最多只能带走一件,请问现在抢劫犯该如何做才能使得背包中的珠宝价值总价最大? |
55 |
| - |
56 |
| -显然,无界背包中的状态及状态方程已经不适用于01背包问题,那么我们来比较这两个问题的不同之处,无界背包问题中同一物品可以使用多次,而01背包问题中一个背包仅可使用一次,区别就在这里。我们将 $$K(\omega)$$ 改为 $$K(i,\omega)$$ 即可,**新的状态表示前 $$i$$ 件物品放入一个容量为 $$\omega$$ 的背包可以获得的最大价值。** |
57 |
| - |
58 |
| -现在从以上状态定义出发寻找相应的状态转移方程。$$K(i-1, \omega)$$为 $$K(i, \omega)$$ 的子问题,如果不放第 $$i$$ 件物品,那么问题即转化为「前 $$i-1$$ 件物品放入容量为 $$\omega$$ 的背包」,此时背包内获得的总价值为 $$K(i-1, \omega)$$;如果放入第 $$i$$ 件物品,那么问题即转化为「前 $$i-1$$ 件物品放入容量为 $$\omega - \omega_i$$ 的背包」,此时背包内获得的总价值为 $$K(i-1, \omega - \omega_i) + v_i$$. 新的状态转移方程用数学语言来表述即为: |
59 |
| -$$K(i,\omega) = \max \{K(i-1, \omega), K(i-1, \omega - \omega_i) + v_i\}$$ |
60 |
| - |
61 |
| -这里的分析是以容量递推的,但是在容量特别大时,我们可能需要以价值作为转移方程。定义状态`dp[i + 1][j]`为前`i`个物品中挑选出价值总和为`j` 时总重量的最小值(所以对于不满足条件的索引应该用充分大的值而不是最大值替代,防止溢出)。相应的转移方程为:前`i - 1` 个物品价值为`j`, 要么为`j - v[i]`(选中第`i`个物品). 即`dp[i + 1][j] = min{dp[i][j], dp[i][j - v[i]] + w[i]}`. 最终返回结果为`dp[n][j] ≤ W` 中最大的 j. |
| 52 | +**注意等式最后一行,咋看和01背包一样,实际上区别在于`dp[i + 1][]`, 01背包中为`dp[i][]`.** 此时时间复杂度简化为 $$O(nW)$$. 和 01 背包的递推关系区别在于第 i 件珠宝是否可以重复取。 |
62 | 53 |
|
63 | 54 | ## 扩展
|
64 | 55 |
|
|
0 commit comments