|
|
8行目: |
8行目: |
| | | |
| | | |
− | :<math>f^*(\xi):=\sup_{x\in{\mathbf{R}^n}} \{ \, \xi^{\top}x - f(x) \, \}</math>
| + | <table align="center"> |
| + | <tr> |
| + | <td><math>f^*(\xi):=\sup_{x\in{\mathbf{R}^n}} \{ \, \xi^{\top}x - f(x) \, \}</math> |
| + | </td> |
| + | </tr> |
| + | </table> |
| | | |
| | | |
16行目: |
21行目: |
| | | |
| | | |
− | :<math>
| + | <table align="center"> |
| + | <tr> |
| + | <td><math> |
| \begin{array}{lll} | | \begin{array}{lll} |
| \mbox{(P)} & \min_{x\in \mathbf{R}^n}& \varphi{(x)} \\ | | \mbox{(P)} & \min_{x\in \mathbf{R}^n}& \varphi{(x)} \\ |
22行目: |
29行目: |
| \end{array} | | \end{array} |
| </math> | | </math> |
| + | </td> |
| + | </tr> |
| + | </table> |
| | | |
| | | |
27行目: |
37行目: |
| | | |
| | | |
− | :<math>U:=\{u\in{\mathbf{R}^m}\,| \inf_{x\in{\mathbf{R}^n}}f(x,u)<+\infty\}\quad V:=\{v\in{\mathbf{R}^n}\,|\inf_{y\in{\mathbf{R}^m}}f^{*}(v,y)<+\infty\}</math>
| + | <table align="center"> |
| + | <tr> |
| + | <td><math>U:=\{u\in{\mathbf{R}^m}\,| \inf_{x\in{\mathbf{R}^n}}f(x,u)<+\infty\}\quad V:=\{v\in{\mathbf{R}^n}\,|\inf_{y\in{\mathbf{R}^m}}f^{*}(v,y)<+\infty\}</math> |
| + | </td> |
| + | </tr> |
| + | </table> |
| | | |
| | | |
44行目: |
59行目: |
| | | |
| | | |
− | :<math>\begin{array}{llll}
| + | <table align="center"> |
− | \mbox{min}_{x\in \mathbf{R}^n} & c^{\top}x+k(x)+h(b-Ax) & & \mbox{(1)}\\ | + | <tr> |
| + | <td><math> |
| + | \begin{array}{llll} |
| + | \mbox{min}_{x\in \mathbf{R}^n} & c^{\top}x+k(x)+h(b-Ax) & & (1)\\ |
| \\ | | \\ |
− | \mbox{max}_{y\in \mathbf{R}^m} & b^{\top}y-h^{*}(y)-k^{*}(A^{\top}y-c) & & \mbox{(2)} | + | \mbox{max}_{y\in \mathbf{R}^m} & b^{\top}y-h^{*}(y)-k^{*}(A^{\top}y-c) & & (2) |
| \end{array} | | \end{array} |
| </math> | | </math> |
| + | </td> |
| + | </tr> |
| + | </table> |
| | | |
| | | |
55行目: |
76行目: |
| | | |
| | | |
− | :<math>
| + | <table align="center"> |
| + | <tr> |
| + | <td> |
| + | <math> |
| \begin{array}{clcll} | | \begin{array}{clcll} |
| (\mbox{P}_{LP}) & \mbox{min.} & c^{\top}x & s. t. & x\ge{0}, \ Ax\ge{b}. \\ | | (\mbox{P}_{LP}) & \mbox{min.} & c^{\top}x & s. t. & x\ge{0}, \ Ax\ge{b}. \\ |
| (\mbox{D}_{LP}) & \mbox{max.} & b^{\top}y & s. t. & y\ge{0}, \ A^{\top}y\le{c}. | | (\mbox{D}_{LP}) & \mbox{max.} & b^{\top}y & s. t. & y\ge{0}, \ A^{\top}y\le{c}. |
| \end{array} | | \end{array} |
− | </math> | + | </math></td> |
| + | </tr> |
| + | </table> |
| | | |
| | | |
66行目: |
92行目: |
| | | |
| | | |
− | :<math>L(x,y):=\inf_{u\in{\mathbf{R}^m}}\{\, f(x,u)-y^{\top}u\,\}</math> <math>\mbox{(3)}\,</math>
| + | <table align="center"> |
− | | + | <tr> |
| + | <td><math>L(x,y):=\inf_{u\in{\mathbf{R}^m}}\{\, f(x,u)-y^{\top}u\,\}</math></td> |
| + | <td width="100" align="right"><math>(3)\,</math> |
| + | </td> |
| + | </tr> |
| + | </table> |
| + | |
| | | |
| と定義する.<math>-L(x,\cdot)=(f(x,\cdot))^{*}, f(x,\cdot)=(-L(x,\cdot))^{*}</math>が成立しているので, | | と定義する.<math>-L(x,\cdot)=(f(x,\cdot))^{*}, f(x,\cdot)=(-L(x,\cdot))^{*}</math>が成立しているので, |
| | | |
− | | + | <table align="center"> |
− | :<math>\varphi{(x)}=\sup_{y}L(x,y), \quad\quad \psi{(y)}=\inf_{x}L(x,y)</math> <math>\mbox{(4)}\,</math>
| + | <tr> |
| + | <td> |
| + | <math>\varphi{(x)}=\sup_{y}L(x,y), \quad\quad \psi{(y)}=\inf_{x}L(x,y)</math></td> |
| + | <td width="100" align="right"><math>(4)\,</math> |
| + | </td> |
| + | </tr> |
| + | </table> |
| | | |
| | | |
| となる.通常,<math>\mbox{inf}_{x}L(x,\bar{y})=L(\bar{x},\bar{y})=\mbox{sup}_{y}L(\bar{x},y)</math>すなわち,すべての <math>x\in{\mathbf{R}^n}</math>と<math>y\in{\mathbf{R}^m}</math> に対して<math>L(x,\bar{y})\ge{L(\bar{x},\bar{y})}\ge{L(\bar{x},y)}</math>が成り立つとき,<math>(\bar{x},\bar{y})</math> を関数 <math>L\, </math> の <math>\mathbf{R}^{n}\times{\mathbf{R}^m}</math> 上での鞍点 (saddle point) と呼ぶ.(4) により, | | となる.通常,<math>\mbox{inf}_{x}L(x,\bar{y})=L(\bar{x},\bar{y})=\mbox{sup}_{y}L(\bar{x},y)</math>すなわち,すべての <math>x\in{\mathbf{R}^n}</math>と<math>y\in{\mathbf{R}^m}</math> に対して<math>L(x,\bar{y})\ge{L(\bar{x},\bar{y})}\ge{L(\bar{x},y)}</math>が成り立つとき,<math>(\bar{x},\bar{y})</math> を関数 <math>L\, </math> の <math>\mathbf{R}^{n}\times{\mathbf{R}^m}</math> 上での鞍点 (saddle point) と呼ぶ.(4) により, |
− |
| |
| | | |
| | | |
92行目: |
129行目: |
| | | |
| が成立する.(iv) を[[鞍点定理]] (saddle point theorem) と呼ぶ.非線形計画問題 | | が成立する.(iv) を[[鞍点定理]] (saddle point theorem) と呼ぶ.非線形計画問題 |
| + | |
| | | |
| :<math>\mbox{(NLP)} \; \; | | :<math>\mbox{(NLP)} \; \; |
102行目: |
140行目: |
| | | |
| | | |
− | :<math>
| + | <table align="center"> |
| + | <tr> |
| + | <td><math> |
| \begin{array}{rll} | | \begin{array}{rll} |
| F(x) &:= & (g_{1}(x),\ldots,g_{k}(x),h_{1}(x),\ldots,h_{l}(x))^{\top}\\ | | F(x) &:= & (g_{1}(x),\ldots,g_{k}(x),h_{1}(x),\ldots,h_{l}(x))^{\top}\\ |
109行目: |
149行目: |
| f(x,u) &:= & f_{0}(x)+\theta{(F(x)+u)} | | f(x,u) &:= & f_{0}(x)+\theta{(F(x)+u)} |
| \end{array} | | \end{array} |
− | </math> | + | </math></td> |
| + | </tr> |
| + | </table> |
| | | |
| | | |
| とおくと,(3) により<math>y=(\lambda,\mu)=(\lambda_{1},\ldots,\lambda_{k},\mu_{1},\ldots,\mu_{l}) \in{\mathbf{R}^{k}_{+}\times{\mathbf{R}^{l}}}</math>に対する問題(NLP)のラグランジュ関数は | | とおくと,(3) により<math>y=(\lambda,\mu)=(\lambda_{1},\ldots,\lambda_{k},\mu_{1},\ldots,\mu_{l}) \in{\mathbf{R}^{k}_{+}\times{\mathbf{R}^{l}}}</math>に対する問題(NLP)のラグランジュ関数は |
| | | |
− | | + | <table align="center"> |
− | :<math>L(x,\lambda,\mu)=f_{0}(x)+\sum_{i=1}^{k}\lambda_{i}g_{i}(x)
| + | <tr> |
− | +\sum_{j=1}^{l}\mu_{j}h_{j}(x)</math> <math>\mbox{(5)}\,</math> | + | <td><math>L(x,\lambda,\mu)=f_{0}(x)+\sum_{i=1}^{k}\lambda_{i}g_{i}(x) |
| + | +\sum_{j=1}^{l}\mu_{j}h_{j}(x)</math></td> |
| + | <td width="100" align="right"><math>(5)\,</math></td> |
| + | </tr> |
| + | </table> |
| | | |
| | | |
122行目: |
168行目: |
| | | |
| | | |
− | :<math>
| + | <table align="center"> |
| + | <tr> |
| + | <td><math> |
| \begin{array}{cllll} | | \begin{array}{cllll} |
| (\mbox{P}_{L}) & \mbox{min.} | | (\mbox{P}_{L}) & \mbox{min.} |
134行目: |
182行目: |
| \end{array} | | \end{array} |
| </math> | | </math> |
| + | </td> |
| + | </tr> |
| + | </table> |
| | | |
| | | |
| となり,一般に問題<math>(\mbox{D}_{L})</math>をラグランジュの双対問題 (Lagrangian dual problem)と呼ぶ.鞍点定理により,<math>L\, </math> の鞍点 <math>(\bar{x},\bar{\lambda},\bar{\mu})</math> が存在すれば,つまり | | となり,一般に問題<math>(\mbox{D}_{L})</math>をラグランジュの双対問題 (Lagrangian dual problem)と呼ぶ.鞍点定理により,<math>L\, </math> の鞍点 <math>(\bar{x},\bar{\lambda},\bar{\mu})</math> が存在すれば,つまり |
| | | |
− | | + | <table align="center"> |
− | :<math>\max_{\lambda\ge{0},\mu}L(\bar{x},\lambda,\mu)=L(\bar{x},\bar{\lambda},\bar{\mu})
| + | <tr> |
− | =\min_{x}L(x,\bar{\lambda},\bar{\mu})</math> | + | <td><math> |
| + | \max_{\lambda\ge{0},\mu}L(\bar{x},\lambda,\mu)=L(\bar{x},\bar{\lambda},\bar{\mu}) |
| + | =\min_{x}L(x,\bar{\lambda},\bar{\mu})</math></td> |
| + | </tr> |
| + | </table> |
| | | |
| | | |
146行目: |
201行目: |
| | | |
| | | |
− | :<math>\bar{L}(x,y):=\inf_{u\in{\mathbf{R}^m}}\{\, f(x,u)+r\sigma{(u)}-y^{\top}u\,\}</math>
| + | <table align="center"> |
| + | <tr> |
| + | <td><math>\bar{L}(x,y):=\inf_{u\in{\mathbf{R}^m}}\{\, f(x,u)+r\sigma{(u)}-y^{\top}u\,\}</math> |
| + | </td> |
| + | </tr> |
| + | </table> |
| | | |
| | | |
【そうついせいりろん (duality theory)】
双対性理論 (duality theory)は,非線形計画のみならず線形計画,多目的計画,離散凸解析などの分野で主問題とその双対問題の関係,および集合や関数の双対関係を説明する重要な基礎理論である [1, 2, 3, 4].
「双対」 (dual) と「共役」 (conjugate) は元々同義語として用いられ,数学の関数解析の分野では,ノルム空間 上の有界線形汎関数の全体を の双対空間 (dual space) または共役空間 (conjugate space) といい, と表して, における の値を または と書く. が 次元実ユークリッド空間 の場合は, と は同一視でき, となり, は と の内積 となる.以下に述べる事柄は,無限次元空間に対しても拡張できるが,ここでは簡単のため に限定して説明する.
空間 上で定義された拡張実数値関数 に対して(ただし,),
|
で定義される関数 を の共役関数 (conjugate function) という.共役関数 に対して,さらにその共役関数 を考えることができるが, が下半連続な真凸関数のときには, は に一致する. に を対応させる写像をルジャンドル-フェンシェル変換 (Legendre-Fenchel transform) と呼ぶ.
下半連続な真凸関数 に対して,関数 と をそれぞれ と で定義し,次の問題(P)と(D)を主問題 (primal problem) とその双対問題 (dual problem) と呼ぶ [1, 4].
|
また,
|
とおくと, と は凸集合となる.このとき,以下が成立する.
または
ここで, は の内部を表す.(i)を弱双対定理 (weak duality theorem),(ii)を双対定理 (duality theorem) と呼び, が満たされるとき,主問題(P)と双対問題(D)の間に双対性 (duality) が成立するという.(i)により, なら主問題(P)は実行可能解を持たないが, となる と が存在すれば,それぞれ(P)と(D)の最適解となり,強い意味の双対性が成立する.一方, となるとき,主問題と双対問題の間に双対性のギャップ (duality gap) が存在するという.
主問題(P)において,(ただし, と は下半連続な真凸関数で, , )とすると,となり [4],主問題(P)と双対問題(D)はそれぞれ
|
となる.ここで または が成立すれば,(ii)により主問題 (1) と双対問題 (2) の間に双対性が成立する.(ただし,dom は拡張実数値関数の実効定義域を表す.)これをフェンシェルの双対性 (Fenchel duality) と呼んでいる.通常は,簡略化して と を零ベクトル, を恒等写像として,新たに を凸関数 と凹関数 の差で表し,主問題 に対して, をフェンシェルの双対問題 (Fenchel dual problem) と呼ぶ.ただし,.双対性は のとき成立する.また, とすると,(1) と(2) は線形計画の主問題と双対問題となる [2, 4].
|
次に,ラグランジュ関数 (Lagrangian function) を
|
|
と定義する.が成立しているので,
|
|
となる.通常,すなわち,すべての と に対してが成り立つとき, を関数 の 上での鞍点 (saddle point) と呼ぶ.(4) により,
がの鞍点
が成立する.(iv) を鞍点定理 (saddle point theorem) と呼ぶ.非線形計画問題
(ただし, は で定義された実数値関数,) に対して,
|
とおくと,(3) によりに対する問題(NLP)のラグランジュ関数は
|
|
となる.この をラグランジュ乗数 (Lagrange multipliers) と呼ぶ.このとき,主問題と双対問題は
|
となり,一般に問題をラグランジュの双対問題 (Lagrangian dual problem)と呼ぶ.鞍点定理により, の鞍点 が存在すれば,つまり
|
が成立すれば, と はそれぞれ問題との最適解となり最適値が一致する.これをラグランジュの双対性 (Lagrangian duality) と呼ぶ.(iv) により, が成立すれば,この双対性が保証される.この等式に対する十分条件を述べた定理をミニマックス定理(minimax theorem) と呼ぶ [1]. 逆に,主問題の目的関数 と制約関数 がすべて凸で, がすべてアフィン関数であるような凸計画問題 (convex programming problem) においては,適当な条件のもとで,問題の最適解 に対して, であるようなラグランジュ乗数 が存在して, がラグランジュ関数 の鞍点となる.さらに,次のような拡張ラグランジュ関数(augmented Lagrangian function) に基づく双対性も考えられている [2, 3, 4].
|
ただし, は正定数, は に対して を満足する下半連続な真凸関数である.関数 の例としては などがある.
参考文献
[1] I. Ekeland and R. Temam, Convex Analysis and Variational Problems, North-Holland, Amsterdam, 1976.
[2] 福島雅夫,『非線形最適化の基礎』, 朝倉書店, 2001.
[3] 今野浩, 山下浩,『非線形計画法』, 日科技連, 1978.
[4] R.T. Rockafellar and R. J-B. Wets, Variational Analysis, Springer, Berlin, 1998.