约束最优化方法之最优性条件

约束最优化方法之最优性条件一般性约束最优性条件前面几篇博客主要讲了无约束最优化问题的一些求解方法 从这一篇博客开始将开始讲有约束的最优化方法 首

前面几篇博客主要讲了无约束最优化问题的一些求解方法。从这一篇博客开始将开始讲有约束的最优化方法。首先说明一下有约束最优化问题的一般形式

mins.t.f(x)s(x)0h(x)=0(1)

。其中,

f:RnR1s:RnRmh:RnRl
。这个问题的意思是,在容许集

D={
x|s(x)0h(x)=0xRn}

中寻找一点

x
,是的对于任意

xD
,都有

f(x)f(x)

从而

x
就是公式(1)的极小点。

在上面介绍了有约束最优化问题的一般形式后,其实我们可以进一步将其分解为等式约束最优化问题、不等式约束最优化问题和一般最优化问题。其中一般最优化问题的如公式(1)所示。等式约束最优化问题的一般形式为 mins.t.f(x)h(x)=0}(2) 其中 f:RnR1h:RnRl 。即等式约束最优化问题中的约束只有等式。
不等式约束最优化问题的一般形式为

mins.t.f(x)s(x)0}(3)

其中

f:RnR1s:RnRm
,即不等式约束最优化问题的中的约束只有不等式。

下面讲等式约束最优化条件以及不等式约束最优化条件。

等式约束最优化条件

等式约束最优化条件的一般形式如公式(2)所示,我们将等式约束的最优化问题中的等式约束拆分为

hj(x)=0j=1,2,...,l

其中 hi:RnR1 。这一问题的求解已经在微积分中通过Lagrange乘子法在理论上得到解决。

定理1:(Lagrange定理重述) 假设
(i) x 是约束问题(2)的局部最优解
(ii) fh1h2...hl:RnR1 x 的某一个邻域内连续可微
(iii) h1(x)h2(x)...hl(x) 线性无关


那么,存在实数 λ1λ2...λl 使得

f(x)j=1lλjhj(x)=0(4)

公式(4)是等式约束问题(2)的最优性一阶必要条件。

首先我们应该知道的是,对于约束最优化问题的局部极小点 x ,不一定有 f(x)=0 ,即 f(x)=0 不再是约束最优化问题的必要条件。而定理1所指出的是,在局部最优点 x 处的导数 f(x) 与所有的约束曲面 hj(x)=0 的交集正交,因为按照定理1,我们知道 f(x)=j=1lhj(x) ,即 f(x) 在由约束曲面的法向量所张成的空间中。

通过这个定理,我们能够将等式约束问题转换为无约束问题,定义一个 n+l 元函数

L(x,λ1,λ2,...,λl)=f(x)+j+1lλjhj(x)(5)

我们将公式(5)称为 Lagrange函数,其中 λ1,λ2,...,λl 称为 Lagrange乘子

Lagrange函数的梯度

L=[xLλL]

其中

xL=f(x)j=1lλjxhj(x)

λL=[h1(x),h2(x),...,hl(x)]T


由此我们知道

min L(x,λ1,λ2,...,λl)(6)

的必要条件是

L(x,λ1,λ2,...,λl)=0

这恰好给出了等式约束问题(2)的最优性条件以及等式约束。

下面给出等式约束最优化问题的充分条件。

定理2: 在等式约束问题(2)中,假设:
(i) f,h1,h2,...,hl:RnR1 是二次连续可微函数
(ii)存在 xRn λRl ,使得Lagrange函数的梯度为0,即

L(x,λ1,λ2,...,λl)=0


(iii)对于满足条件

vThj(x)=0j=1,2,...,l

的任意非零向量 vRn ,都有

vT2kL(x,λ)v>0

那么, x 是等式约束最优化问题(2)的严格局部极小点。

定理2的几何意义是在Lagrange函数的驻点 [xλ]T 处,如果Lagrange函数关于 x 的Hesse矩阵在

l
个约束超平面的切平面的交集上正定,那么 x 就是严格局部极小点。

不等式约束最优化条件

对于不等式约束的一般形式(3)我们换一种方法表示。首先我们用 D 表示容许集,



D={x|si(x)0,i=1,2,...,m}

那么不等式约束的一般形式(3)又可以写为

mins.t.f(x)xD}(7)


定义1:对于不等式约束最优化问题(3)。设 x~D ,若 x~ 是的某个不等式的约束 si(x~)=0 ,则该不等式约束 si(x)0 称为是关于容许点 x~ 起作用约束;否则,若 si(x)>0 ,则该不等式约束称为是关于容许点 x~ 不起作用约束



约束最优化方法之最优性条件




通过定义1我们能够清楚的知道,只有容许集边界上的点才能使得某一个或这某些约束条件起作用。对于上图,我们可以看出,点 AB 都是容许点,所有的约束对于容许点B来说都是不起作用约束, s2(x) 对于容许点A是起作用约束。

几何最优性条件

定义2: C

Rn
中的非空集,且 xC 。对于 pRn ,若当 x+pC 时,对于 t0 ,必有 x+tpC ,则集合 C 称为以

x
为定点的,若锥 C 为凸集,正称为凸锥
由向量

v1,v2,...,vm
的所有非负组合构成的集合

C={
x|x=i=1mγivi,γi0}

是一个以原点为定点的凸锥,由于这样的凸锥的边界是超平面或直线,所以也称为由 v1,v2,...,vm 张成的 凸多面锥
定义3:(容许方向向量,容许方向锥) D

Rn
中的非空集,且 xD ,对于非零向量 pRn ,若存在 δ>0 ,当 t(0,δ) 时,必有 x+tpD ,则称 p 是点

x
容许方向向量,其方向称为点 x d的 容许方向。由点

x
的所有容许方向向量构成的集合称为点 x 容许方向锥
引理3:

x~D={x|si(x~)0,i=1,2,...,m}
I={
i|si(x~)=0,i=1,2,...,m}
;并设 iI 时, si(x) 在点 x~ 处可微,当 iI 时, si(x) 在点 x~ 处连续。若向量 p 对于所有的

iI
,都有 si(x~)Tp>0 ,则 p 是点

x~
的一个容许方向向量。
通过引理3我们知道,若某一个容许点 x~ 近使某一个约束 si(x)0 变为起作用约束,而其他约束仍为不起作用约束时,可以知道 p=si(x~) 为点 x~ 处的容许方向向量。若容许点 x~ 使多个约束变为起作用约束,并记集合 I 为起作用约束的下标的集合,那么方向向量

p
若能使得所有的 si(x~)Tp>0 ,此时 p 为容许方向向量。

定理4:

f:RnR1
在点 x 处可微,则点

x
处的下降方向向量 p 比满足



f(x)Tp<0

定理5和定理6仅给出了必要的最优性条件,而没有充分最优性条件。为什么不是充分条件也许很难理解,其实这主要是针对于容许集中某些点可能存在容许方向锥是空集的情况,比如下面的例子。

mins.t.x1x21x21x2201+x21+x220

对于上式,所有的容许点(即在 x21+x22=1 上的点)均没有容许方向,所以必有容许方向锥和下降方向集的交集为空。所以容许方向锥和下降方向集的交集为空只是极小点的必要条件而不是充分条件。

Fritz John条件



aTip0,i=1,2,...,m

的向量 p 也满足



bTp0

的充要条件是,存在非负数 γ1,γ2,...,γm ,使得

b=i=1mγiai

简单理解: 如下图所示,由于所有的 ai 都有 aTip<0 ,可以简单的认为所有的向量 ai 都在超平面 s1 的一侧,获得认为任意两个向量之间的夹角都要小于 π ,又由于 bTp0 ,所以向量 b 与向量

ai
都在超平面 s1 一侧,所以存在非负数 γi 使得杰伦成立。



约束最优化方法之最优性条件




引理8:(Gordan) a1,a2,...,am b 是n维向量,则不存在向量

p
使得

aTip<0i=1,2,...,m

成立的充要条件是,存在不全为零的非负数 γ1,γ2,...,γm ,使得

i=1mγiai=0

简单理解: 根据引理8描述,我们知道必有向量 ai 使得 ai=jiβjaj ,可以理解为下图。即存在一个超平面 s1 使得向量 si 分在超平面两侧;若所有向量 ai 都在超平面的一侧,必定存在另一条向量在超平面的另一侧使得 aTip<0 (表述有点问题,我是这么理解的)。



约束最优化方法之最优性条件




注: 上面的简单理解部分只是帮助理解这两个引理,并不正确,上面两个引理的证明比较繁琐,这里就不再证明。可以理解记忆,对于空间中的两个向量 ab ,如果 aTb<0 ,则向量 a

b
的夹角为钝角;若 aTb>0 ,则夹角为锐角;若 aTb=0 ,则夹角为直角。下面给出FJ条件。

定理9:(Fritz John) 在不等式约束最优化问题(3)中,设 x 是局部最优解, f(x) s1(x)s2(x)...sm(x) 在点 x 处可微。那么,存在不全为零的实数 μ0μ1...μm ,使得

μ0f(x)i=1mμisi(x)=0μisi(x)=0i=1,2,...,mμi0i=0,1,...,m

证明: 由于 x 是极小点,根据定理6我们知道,比不存在向量 p 使得



f(x)Tp<0

si(x)Tp<0iI(I)

根据引理8,可知必存在不全为零的数

μ00μi0iI

使得

μ0f(x)iIμisi(x)=0

上式经过改写就是定理9(在定理9中,所有不起作用约束的 μi 均为0)。

f(x)=iIμiμ0si(x)

由于 f(x) 为函数 f(x) 的上升方面,对于任意容许方向向量 p ,必有



si(x)Tp0iI

因为约束条件为 si(x)0 ,所以对于在 x 起作用的约束上式必然成立,因为上式成立所以也有 f(x)0 成立,即对于所有的容许方向来说都不是下降方向。
这部分思考内容不一定正确,只是有助于自己的理解,这样思考也有助于记忆FJ条件会存在一些缺点,即 μ0 为0的时候,上面的思考就不成立。
)

Kuhn Tucker条件

其实,对于FJ条件,还是存在一定情况使得FJ条件失效的,加入对于在点 x 处起作用的点的 si(x) 是线性相关的的,即存在 μi 使得

iIμisi(x)=0

,那么此时可以让 μ0=0 使得定理9仍然成立,但是计算出来的结果已经不是我找的最优解,此时FJ条件失去价值。若要求在 x 处起约束作用的条件的 si(x) 线性无关,便得到了KT条件。关于KT条件我们不在证明。

定理10:(Kuhn-Tucker) 在不等式约束最优化问题(3)中,假设:i) x 是局部最优点;ii) f(x)s1(x)s2(x)...sm(x) 在点 x 处可微;iii)点 x 处全部起作用的约束线性无关。那么存在实数 μ0μ1...μm ,使得

f(x)i=1mμisi(x)=0μisi(x)=0i=1,2,...,mμi0i=1,2,...,m

一般性约束最优性条件

μ0f(x)i=1mμisi(x)i=1lλih(x)=0μisi(x)=0i=1,2,...,mμi0i=0,1,...,m


定理12:(Kuhn-Tucker) 在约束最优化问题(1)中,假设:i) x 是局部最优点;ii) f(x)s1(x)s2(x)...sm(x);h1(x)h2(x)...hl(x) 在点 x 处可微;iii)点 x 处全部起作用的约束线性无关。那么存在实数 μ0μ1...μm ,使得

f(x)i=1mμisi(x)i=1lλih(x)=0μisi(x)=0i=1,2,...,mμi0i=1,2,...,m















版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/218531.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月18日 上午7:02
下一篇 2026年3月18日 上午7:02


相关推荐

  • Java数组的定义与使用

    Java数组的定义与使用文章目录前言一 数组的概念二 数组的定义三 数组的初始化 1 数组的静态初始化 2 数组的动态初始化 3 区别四 数组的使用总结前言数组是学习 Java 的一个重要重要工具 对我们以后项目的构建也有重要的帮助 今天我们来了解一下数组的定义与使用 一 数组的概念在大部分语言中其中数组内的每个元素被称为数组元素 我们可以通过访问下标来寻找数组元素二 数组的定义代码如下 publicclasss publicstatic String args

    2026年3月17日
    2
  • Android 在本地应用 启动抖音(进入主页)

    Android 在本地应用 启动抖音(进入主页)

    2021年3月12日
    655
  • window2012 密钥 标准版_Windows Server 2012 R2 密钥「建议收藏」

    window2012 密钥 标准版_Windows Server 2012 R2 密钥「建议收藏」WindowsServer2012R2安装包:百度云盘:链接:https://pan.baidu.com/s/1gweJ9GhWdT8DJF23xphUsw提取码:1ntqServerStandard标准版安装密钥:BNHD9-KT7MY-4BX83-HTGM4-3C77JNB4WH-BBBYV-3MPPC-9RCMV-46XCBDXHGK-GRJQH-K7WVV-NTXP3-YBFG…

    2022年10月14日
    4
  • 离心泵CAE_2_ICEM剖分网格_2_叶轮流道[通俗易懂]

    离心泵CAE_2_ICEM剖分网格_2_叶轮流道[通俗易懂]针对本科毕设中所涉及到的离心泵数值分析和性能计算,将用最简单粗暴的方法,讲解如何基于CFturbo、ICEM、FLUENT来开展离心泵水力设计和性能分析的计算机辅助(CAE)实现。离心泵的水力设计由CFturbo软件实现;网格剖分由ICEM软件实现;CFD数值计算由FLUENT软件实现;并验证设计值是否达到。这里是第二部分,ICEM软件实现离心泵过流通道的网格剖分,含叶轮流道、进口延伸段、蜗壳流道的网格剖分。由于三个流道分开来划分网格,所以分三部分来分别讲解,这里是第2篇,叶轮流道的网格剖分……

    2022年5月26日
    49
  • jetty配置文件_jetty服务日志配置

    jetty配置文件_jetty服务日志配置jetty9配置contextPath说明:目录结构:webapps——-demo.war——-demo.xmldemo.xml文件内容//webapps/demo.war

    2025年12月14日
    7
  • Jmeter教程(一) – 入门

    Jmeter教程(一) – 入门一、下载登录官网Jmeter下载,得到压缩包jmeter-5.0.tgz,下载地址:http://jmeter.apache.org/download_jmeter.cgi。二、安装将下载得到的压缩包解压即可,这里我解压到自己电脑的路径为E:\Mysoftware\apache-jmeter-5.0。三、运行点击bin目录下的jmeter.bat即可启动Jmeter。启动后可以看到…

    2022年6月6日
    37

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号