凸优化学习笔记:Duality 对偶问题
拉格朗日对偶函数
minimize subject to f0(x)fi(x)≤0,i=1,...,mhi(x)=0,i=1,...,p
假设最优值为p∗
Lagrangian duality是将约束通过加权合并到目标函数中,L:Rn×Rm×Rp→R。
L(x,λ,ν)=f0(x)+Σi=1mλifi(x)+Σi=1pνihi(x)
其中λi,νi为拉格朗日乘数。
拉格朗日对偶函数为
g(λ,ν)=inf L(x,λ,ν)=inf (f0(x)+Σi=1mλifi(x)+Σi=1pνihi(x))
是凹的,与原问题的凹凸性无关。
最优值的下界
假设在x∗处取的最优值f0(x)=p∗,此时由于λ⪰0,
Σi=1mλifi(x)小于0,虽然ν的符号不确定,但是hi=0,因此有
L(x,λ,ν)=f0(x)+Σi=1mλifi(x)+Σi=1pνihi(x)≤f0(x)
g(λ,ν)≤L(x,λ,ν)≤f0(x)
该式对任意x成立,因此有g(λ,ν)≤p∗
g能给出下界。
拉格朗日对偶问题
对任意对(λ,ν),拉格朗日对偶函数都能给出一个最优值的下界。但最优的下界是什么?
maximize subject to g(λ,ν)λ⪰0
该问题称为原问题的拉格朗日对偶问题。原问题则称为primal problem。
dual feasible意为λ⪰0,g(λ,ν)>−∞
该问题的最优解λ∗,ν∗被称为dual optimal或optimal Lagrange multipliers。该问题是凸问题,与原问题的凹凸性无关。
p∗−d∗被称为duality gap
例:QCQP的拉格朗日对偶
minimize subject to (1/2)xTP0x+q0Tx+r0(1/2)xTPix+qiTx+ri≤0,i=1,...,mP0∈S++n,Pi∈S+n
其拉格朗日函数为
L(x,λ)==P(λ)=q(λ)=r(λ)=(1/2)xTP0x+q0Tx+r0+Σi=1m(λi/2)xTPix+λiqiTx+λiri(1/2)xTP(λ)x+q(λ)Tx+r(λ)P0+Σi=1mλiPi,q0+Σi=1mλiqi,r0+Σi=1mλiri.
其取最值处应有
∇L==x=L(−P−1(λ)q(λ)T,λ)=0P(λ)x+q(λ)T−P−1(λ)q(λ)T−(1/2)q(λ)TP(λ)−1q(λ)+r(λ)
g(λ)==inf L(x,λ)−(1/2)q(λ)TP(λ)−1q(λ)+r(λ)
KKT优化条件
假定函数f0,...,fm,h1,...,hp可微。
假设x∗和(λ∗,ν∗)分别是primal和对偶问题的最优解,且duality gap为0
由于x∗为L(x,λ∗,ν∗)的极值点,该处梯度应为0。
∇f0(x∗)+Σi=1mλi∗∇fi(x∗)+Σi=1pvi∗∇hi(x∗)=0
Karush-Kuhn-Tucker(KKT)条件即为
fi(x∗)≤0hi(x∗)=0λi∗≥0λi∗fi(x∗)=0∇f0(x∗)+Σi=1mλi∗∇fi(x∗)+Σi=1pvi∗∇hi(x∗)=0
在凸优化中,如果原问题和对偶问题都具有凸形式,那么它们的最优值是相等的。这意味着原问题的最优解和对偶问题的最优解是一致的。
在任何满足以下条件的凸优化问题中:
- 目标函数和约束函数都是可微的。
- 强对偶性成立,即原问题和对偶问题的最优值相等。
对于这样的问题,原问题的最优解和对偶问题的最优解必须满足KKT条件。这意味着,如果一个点是原问题的最优解,那么它必须满足KKT条件;同样,如果一个点是对偶问题的最优解,它也必须满足KKT条件。
简而言之,KKT条件是强对偶性成立的一个必要条件。
其他参考资料
一个非常好的KKT解读