机器学习:优化算法(三)—— 拉格朗日对偶法

在有约束的最优化问题中,常常利用拉格朗日对偶法(Lagrange duality)将原始问题转化为对偶问题,通过求解对偶问题得到原始问题的解。

原始问题

假设$f(x),\ c_i(x),\ h_j(x)$是定义在$\mathbb{R}^n$上的连续可微函数,考虑带约束的最优化问题:

拉格朗日函数的极小极大问题

拉格朗日函数:$\alpha_i,\ \beta_j$为拉格朗日乘子,其中 $\alpha_i\geqslant 0$

令:

有:

带约束的原始问题可以转化为无约束的拉格朗日函数极小极大问题:

拉格朗日的极大极小问题(对偶问题)

令:

拉格朗日的极大极小问题:

KKT 条件

定理1(弱对偶性):如果原始问题和对偶问题都有最优解,则对偶问题的最优值是原始问题最优值的一个下界:

证明:强者中最弱的也比弱者中最强的要强

故:

定理2(强对偶性):假设$f(x)$和$c_i(x)$是凸函数,$h_j(x)$是仿射函数,并且不等式约束$c_j(x)$是严格可行的,即存在x对所有i都有$c_i(x)<0$,则$x^$和$\alpha^, \beta^$分别是原始问题和对偶问题的解的充要条件是$x^,\alpha^, \beta^$满足KKT条件:

$\alpha_i c_i(x^)=0$称为KKT的对偶互补条件,$\alpha_i ,\ c_i(x^*)$必有一个为0.

坚持原创技术分享,您的支持将鼓励我继续创作!