dp优化（俞玮）

基本动态规划问题的扩展

应用动态规划可以有效的解决许多问题，其中有许多问题的数学模型，尤其对一些自从57年就开始研究的基本问题所应用的数学模型，都十分精巧。有关这些问题的解法，我们甚至可以视为标准——也就是最优的解法。不过随着问题规模的扩大化，有些模型显出了自身的不足和缺陷。这样，我们就需要进一步优化和改造这些模型。

一. 程序上的优化：

程序上的优化主要依赖问题的特殊性。我们以f(X^T)= opt{f(u^T)}+ A(X^T), u^TÎ Pred_Set(X^T)这样的递推方程式为例（其中A(X^T)为一个关于X^T的确定函数，Pred_Set(X^T)表示X^T的前趋集）。我们设状态变量X^T的维数为t，每个X^T与前趋中有e维改变，则我们可以通过方程简单的得到一个时间复杂度为O(n^t+e)的算法。

当然，这样的算法并不是最好的算法。为了简化问题，得到一个更好的算法。我们设每个X^T所对应的g(X^T)=opt{f(u^T)}，则f(X^T)=g(X^T)+A(X^T)，问题就变为求g(X^T)的值。下面分两个方面讨论这个问题：

1. Pred_Set(X^T)为连续集：

在这样的情况下，我们可以用g(X^T)= opt{g(Pred(X^T)), f(Pred(X^T))}这样一个方程式来求出g(X^T)的值，并再用g(X^T)的值求出f(X^T)的值。这样，虽然我们相当于对g(X^T)和f(X^T)分别作了一次动态规划，但由于两个规划是同时进行的，时间复杂度却降为了O(n^t)。由于我们在实际使用中的前趋即通常都是连续的，故这个方法有很多应用。例如IOI’99的《小花店》一题就可以用该方法把表面上的时间复杂度O(FV²)降为O(FV)。

2. Pred_Set(X^T)为与X^T有关的集合：

这样的问题比较复杂，我们以最长不下降子序列问题为例。规划方程为：f(i)=max{f(j)}+1, d[i]≥ d[j]; i>j。通常认为，这个问题的最低可行时间复杂度为O(n²)。不过，这个问题只多了一个d[i]≥d[j]的限制，是不是也可以优化呢？我们注意到max{f(j)}的部分，它的时间复杂度为O(n)。但对于这样的式子，我们通常都可以用一个优先队列来使这个max运算的时间复杂度降至O(log n)。对于该问题，我们也可以用这样的方法。在计算d[i]时，我们要先有一个平衡排序二叉树（例如红黑树）对d[1]~d[i-1]进行排序。并且我们在树的每一个节点新增一个MAX域记录它的左子树中的函数f的最大值。这样，我们在计算f(i)时，只需用O(log n)时间找出不比d[i]大的最大数所对应的节点，并用O(1)的时间访问它的MAX域就可以得出f(i)的值。并且，插入操作和更新MAX域的操作也都只用O(log n)的时间（我们不需要删除操作），故总时间复杂度为O(n log n)。实际运行时这样的程序也是十分快的，n=10000时用不到1秒就可以得出结果，而原来的程序需要30秒。

从以上的讨论可以看出，再从程序设计上对问题优化时，要尽量减少问题的约束，尽可能的化为情况1。若不可以变为情况1，那么就要仔细考虑数据上的联系，设计好的数据结构来解决问题。

二. 方程上的优化：

对于方程上的优化，其主要的方法就是通过某些数学结论对方程进行优化，避免不必要的运算。对于某一些特殊的问题，我们可以使用数学分析的方法对写出的方程求最值，这样甚至不用状态之间的递推计算就可以解决问题。不过用该方法解决的问题数量是在有限，并且这个方法也十分复杂。不过，却的确有相当数量的比较一般的问题，在应用某些数学结论后，可以提高程序的效率。

一个比较典型的例子是最优排序二叉树问题（CTSC96）。它的规划方程如下：

我们可以从这个规划方程上简单的得到一个时间复杂度为O(n³)的算法。但是否会有更有效的算法呢？我们考虑一下w(i, j)的性质。它表示的是结点i到结点j的频率之和。很明显，若有[i, j]Í[i’, j’]，则有w[i, j]£ w[i’, j’]，这样可知C[i, j]具有凸性^[1]。为了表示方便，我们记C_k(i, j)=w(i, j)+C[i, k-1]+C[k, j]，并用K_i,j表示取到最优值C[i, j]时的C_k(i, j)的k值。我们令k=K_i,j-1，并取i< k’< k。由于k’< k£ j-1< j，故有：

C[k’, j-1]+ C[k, j]£ C[k’, j]+ C[k, j-1]

在等式两侧同时加上w(i, j-1)+ w(i, j)+C[i,. k-1]+ C[i, k’-1]，可得：

C_k’(i, j-1)+ C_k(i, j)£ C_k’(i, j)+ C_k(i, j-1)

由k的定义可知C_k(i, j-1)£ C_k’(i, j-1)，故C_k(i, j)£ C_k’(i, j)，所以k’¹ K_i,j，故K_i,j³ K_i,j-1。同理，我们可得K_i,j£ K_i+1,j，即K_i,j-1£K_i,j£K_i+1,j。这样，我们就可以按对角线来划分阶段（就是按照j-i划分阶段）来求K_i,j。求K_i,j的时间复杂度为O(K_i+1,j-K_i,j-1+1)，故第d阶段（即计算K_1,1+d~K_n-d,n）共需时O(K_n-d+1,n-K_1,d+n-d)£ O(n)。有共有n个阶段，故总时间复杂度为O(n²)。

虽然这道题由于空间上的限制给这个算法的实际应用造成了困难，不过这种方法却给我们以启示。

我们在考虑IOI2000的POST问题。这一题的数学模型不是讨论的重点，我们先不加讨论，直接给出规划方程。从规划方程直接得出的算法的时间复杂度为O(n³)。从这个规划方程可以看出，它的每一阶段都只与上一阶段有关。故我们可以把方程变得简单些，变为对如下的方程执行n次：

在递推时，阶段之间时没有优化的余地的，故优化的重点就在于这个方程的优化上。我们用B[i, j]表示D[i]+w(i, j)，而原算法就是求出B并对每一列求最小值。

事实上，这一题的w有其特殊的性质：

对于a£ b£ c£ d，我们有w(a, c)+ w(b, d)£ w(a, d)+ w(b, c)。

这一性质对解题是应该有所帮助的。仿照上例，在两侧加上D[a]+ D[b]，可得B[a, c]+ B[b, d]£ B[a, d]+ B[b, c]。

也就是说，若B[a, c]³ B[b, c]，则有B[a, d]³ B[b, d]。于是我们在确定了B[a, c]与B[b, c]的大小关系之后，就可以决定是不是需要比较B[a, d]与B[b, d]的大小。[U1]

更进一步的，我们只要找出满足B[a, h]³ B[b, h]的最小的h，就可以免去h之后对第a列的计算。而这样的h，我们可以用二分查找法在O(log n)时间内找到（若w更特殊一些，例如说是确定的函数，我们甚至可以在O(1)的时间找到）。并且对于每一行来说，都只需要执行一次二分查找。在求出所有的h之后，只需用O(n)的时间对每列的第h行求值就可以了。这样得出的总时间为O(n)+O(n log n)= O(n log n)。至于程序设计上的问题，虽然并不复杂，但不是15分钟所可以解决的，也不是重点，略过不谈。^[2]不过由于该题目可以用滚动数组的技巧解决空间的问题，故在大数据量时该算法有优异的表现。

从上面的叙述可以看出，对于方程的优化主要取决于权函数w的性质。其中应用最多的就是w(a, c)+ w(b, d)£ w(a, d)+ w(b, c)这个不等式。实际上，这个式子被称作函数的凸性判定不等式。在实际问题中，权函数通常都会满足这个不等式或这是它的逆不等式。故这样的优化应用是比较广泛的。还有许多特殊的不等式，若可以在程序中应用，都可以提高程序的效率。

三. 从低维向高维的转化：

在问题扩大规模时，有一种方式就是扩大问题的维数。这时，规划时决策变量的维数也要增加。这样，存储的空间也要随着成指数级增加，导致无法存储下所有的状态，这就是动态规划的维数灾难问题。如果我们还要在这种情况下使用动态规划，那么就要使用极其复杂的数学分析方法。对于我们来说，使用这种方法显然是不现实的。这时，我们就需要改造动态规划的模型。通常我们都可以把这时的动态规划模型变为网络流模型。

对于模型的转化方法，我们有一些一般的规律。若状态转移方程只与另一个状态有关，我们可以肯定得到一个最小费用最大流的模型^[3]。这个模型必然有其规律的地方，甚至用对偶算法在对网络流的求解时也还要用到动态规划的方法。不过这不是重点，我们关心的只是动态规划问题如何转化。例如说IOI’97《火星探测器》一题。这一题的一维模型是可以用动态规划来解决的（这里的维数概念是指探测器的数目）。在维数增加时，我们就可以用该方法来用网络流的方法解决问题。

除此之外，还有许多问题可以用该方法解决。例如最长区间覆盖问题，在维数增加时也同样可以用该方法解决。更进一步来说，甚至图论的最短路问题也可以做同样的转化来求出特殊的最短路。不过一般来说转化后流量最大为1，有许多特殊的性质也没有得到应用，并且些复杂的动态规划问题还无法转化为网络流问题（例如说最优二叉树问题），故标准的网络流算法显然有些浪费，它的解决还需要进一步的研究。

参考文献：

[EGG88] David Eppstein, Zvi Galil and Raffaele Giancarlo, Speeding up Dynamic Programming

[GP90] Zvi Galil and Kunsoo Park, Dynamic Programming with Convexity, Concavity, and Sparsity

[附录]

[1] C[i, j]的凸性是指对于任意的a£ b£ c£ d，都有C[a, c]+ C[b, d]£ C[a, d]+ C[b, c]。它的证明如下：

我们设k=K_b,c，则有C[a, c]+ C[b, d]£ C[a, k-1]+ C[k, c]+ C[b, k-1]+ C[k, d]+ w(a, c)+ w(b, d)= C[a, k-1]+ C[k, d]+ w(a, d)+ C[b, k-1]+ C[k, c]+ w(b, c)= C[a, d]+ C[b, c]。得证。

[2] 有关这个问题的伪代码如下：

begin

E[1]ßD[1];

Queue.Add(K:1, H:n);

for jß2 to n do

begin

if B(j-1, j)£ B(Queue.K[head], j) then

begin

E[j]ßB(j-1, j);

Queue.Empty;

Queue.Add(K:j-1, H:n+1);

end else

begin

E[j]ßB(Queue.K[head], j);

while B(j-1, Queue.H[tail-1])£ B(Queue.K[tail], Queue.H[tail-1]) do Queue.Delete(tail);

Queue.H[tail]ßh(Queue.K[tail], j-1);

if h_OK then Queue.Add(K:j-1, H:n+1);

end;

if Queue.H[head]=j+1 then Queue.SkipHead;

end;

end;

其中的队列Queue可以称作备选队列，其中的队列头为第j行的最小值，并假设Queue.H[0]=j。其中的h(a, b)函数是用二分查找法查找B(a, h)³ B(b, h)的最小的h值，h_OK为查找成功与否的标志。在备选队列Queue中的数据(K:i_r, H:h_r)的意义是：当行数在区间[h_r-1, h_r-1]的范围内时，第i_r列为最小值。

[3] 我们知道，动态规划实际是求无向图的最短路的一种方法，故我们可以把动态规划中的每一个状态看成一个点，并将状态的转移过程变为一个图。在转化为最小费用最大流时，我们把这一个点拆成两个点，一个出点和一个入点，所有指向原来这个点的边都与入点相连，且所有由原来这个点发出的边现都以出点为起点。原来的边的容量设为正无穷，边权值一般不变。新增的入点与出点之间连一条边，它的权值为点权值，容量为每一点可以经过的次数（一般为一）。并且建立一个超级源和一个超级汇，并与可能的入点和出点连边。若有必要，超级源（或汇）也要拆成两个点，并且两个点之间的边的容量为最大的可能容量，边权值为0。这样，用最小费用流的方法得出的解就是该问题多维情况下的接。

posted on 2009-04-11 10:26 icecream 阅读(515) 评论(0) 编辑收藏引用所属分类: DP

只有注册用户登录后才能发表评论。




网站导航: 博客园 IT新闻 BlogJava 博问 Chat2DB 管理

icecream

dp优化（俞玮）

My Links

Blog Stats

常用链接

留言簿

随笔分类

随笔档案

文章分类

ACMER

搜索

最新评论

阅读排行榜

评论排行榜